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Enfoque general y nivel matemático 


Al elaborar la novena edición, nuestro interés principal no fue tan sólo agregar material 
nuevo sino brindar claridad y mejor comprensión. Este objetivo se logró en parte al in- 
cluir material nuevo al final de los capítulos, lo cual permite que se relacionen mejor. 
Con cierto afecto llamamos “contratiempos” a los comentarios que aparecen al final de 
los capítulos, pues son muy útiles para que los estudiantes recuerden la idea general y la 
forma en que cada capítulo se ajusta a esa imagen; así como para que entiendan las limi- 
taciones y los problemas que resultarían por el uso inadecuado de los procedimientos. 
Los proyectos para la clase favorecen una mayor comprensión de cómo se utiliza la es- 
tadística en el mundo real, por lo que añadimos algunos proyectos en varios capítulos. 
Tales proyectos brindan a los estudiantes la oportunidad de trabajar solos o en equipo, y 
de reunir sus propios datos experimentales para realizar inferencias. En algunos casos, el 
trabajo implica un problema cuya solución ejemplifica el significado de un concepto, o 
bien, favorece la comprensión empírica de un resultado estadístico importante. Se am- 
pliaron algunos de los ejemplos anteriores y se introdujeron algunos nuevos para crear 
“estudios de caso”, los cuales incluyen un comentario para aclarar al estudiante un con- 
cepto estadístico en el contexto de una situación práctica. 

En esta edición seguimos haciendo énfasis en el equilibrio entre la teoría y las apli- 
caciones. Utilizamos el cálculo y otros tipos de conceptos matemáticos, por ejemplo, de 
álgebra lineal, casi al mismo nivel que en ediciones anteriores. Las herramientas analíti- 
cas para la estadística se cubren de mejor manera utilizando el cálculo en los casos 
donde el análisis se centra en las reglas de los conceptos de probabilidad. En los capítulos 
2 а 10 se destacan las distribuciones de probabilidad y la inferencia estadística. En 
los capítulos 11 a 15, en los cuales se estudian la regresión lineal y el análisis de varian- 
za, se aplica un poco de álgebra lineal y matrices. Los estudiantes que utilizan este libro 
deben haber cursado el equivalente a un semestre de cálculo diferencial e integral. El 
álgebra lineal es útil aunque no indispensable, siempre y cuando el instructor no cubra la 
sección sobre regresión lineal múltiple del capítulo 12 utilizando álgebra de matrices. Al 
igual que en las ediciones anteriores, y con la finalidad de desafiar al estudiante, muchos 
ejercicios se refieren a aplicaciones científicas y de ingeniería a la vida real. Todos los 
conjuntos de datos asociados con los ejercicios están disponibles para descargar del sitio 
web http://www.pearsonenespañol.com/walpole. 
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Resumen de los cambios en la novena edición 


* Para brindar una mayor comprensión del uso de la estadística en el mundo real, en 
varios capítulos se agregaron proyectos para la clase. Los estudiantes tienen que ge- 
nerar o reunir sus propios datos experimentales y realizar inferencias a partir de ellos. 


* Se agregaron más estudios de caso y otros se ampliaron para ayudar a los usuarios 
a comprender los métodos estadísticos que se presentan en el contexto de una si- 
tuación real. Por ejemplo, la interpretación de los límites de confianza, los límites 
de predicción y los límites de tolerancia se exponen utilizando situaciones de la 
vida real. 


* Se agregaron “contratiempos” al final de algunos capítulos y en otros se ampliaron 
los que ya se incluían. El objetivo de dichos comentarios es presentar cada capítulo 
en el contexto de la idea general y analizar la forma en que los capítulos se relacio- 
nan entre sí. Otro objetivo es advertir acerca del uso inadecuado de las técnicas 
estadísticas examinadas en el capítulo. 


• El capítulo 1 se mejoró y ahora incluye más estadísticos de una sola cifra y técni- 
cas gráficas. También se incluyó nuevo material fundamental sobre muestreo y 
diseño experimental. 


e Los ejemplos que se agregaron en el capítulo 8 sobre las distribuciones de mues- 
treo tienen la finalidad de motivar a los estudiantes a realizar las pruebas de hipó- 
tesis y de los valores P. Esto los prepara para el material más avanzado sobre los 
temas que se presentan en el capítulo 10. 


e El capítulo 12 contiene más información sobre el efecto que tiene una sola variable 
de regresión en un modelo que presenta una gran colinealidad con otras variables. 


e El capítulo 15 ahora introduce material sobre el importante tema de la metodología 
de superficie de respuesta (MSR). El uso de las variables del ruido en la MSR permite 
ejemplificar los modelos de la media y la varianza (superficie de respuesta doble). 


• En el capítulo 15 se introduce el diseño compuesto central. 


e El capítulo 18 incluye más ejemplos y un mejor análisis de cómo se utilizan los 
métodos bayesianos para la toma de decisiones estadísticas. 


Contenido y planeación del curso 


Este libro está diseñado para un curso de uno o dos semestres. Un plan razonable para el 
curso de un semestre podría incluir los capítulos 1 a 10, lo cual daría como resultado 
un programa que concluye con los fundamentos de la estimación y la prueba de hipóte- 
sis. Los profesores que desean que los estudiantes aprendan la regresión lineal simple 
podrían incluir una parte del capítulo 11. Para quienes deseen incluir el análisis de 
varianza en vez de la regresión, el curso de un semestre podría incluir el capítulo 13 en 
vez de los capítulos 11 y 12. El capítulo 13 trata el tema del análisis de varianza de un 
factor. Otra opción consiste en eliminar partes de los capítulos 5 o 6, así como el capítulo 
7. Al hacer esto se omitirían las distribuciones discretas о continuas, mismas que inclu- 
yen la binomial negativa, la geométrica, la gamma, la de Weibull, la beta y la logarítmi- 
ca normal. Otros contenidos que se podrían omitir en un programa de un semestre son 
la estimación de máxima verosimilitud, la predicción y los límites de tolerancia del 
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capítulo 9. El programa para un semestre suele ser flexible, dependiendo del interés que 
el profesor tenga en la regresión, el análisis de varianza, el diseño experimental y los 
métodos de superficie de respuesta (capítulo 15). Existen varias distribuciones discretas 
y continuas (capítulos 5 y 6) que tienen aplicaciones en diversas áreas de la ingeniería y 
las ciencias. 

Los capítulos 11 a 18 incluyen una gran cantidad de material que se podría agregar 
al segundo semestre, en caso de que se eligiera un curso de dos semestres. El material 
sobre la regresión lineal simple y múltiple se estudia en los capítulos 11 y 12, respecti- 
vamente. El capítulo 12 puede ser muy flexible. La regresión lineal múltiple incluye 
“temas especiales”, como variables categóricas o indicadoras, métodos secuenciales 
para la selección de modelos, por ejemplo, la regresión por etapas, el estudio de residua- 
les para la detección de violaciones de supuestos, la validación cruzada y el uso de los 
estadísticos PRESS, así como el de C, y la regresión logística. Se hace hincapié en el uso 
de regresores ortogonales, un precursor del diseño experimental en el capítulo 15. Los 
capítulos 13 y 14 ofrecen hasta cierto grado material abundante sobre el análisis de va- 
rianza (ANOVA), con modelos fijos, aleatorios y mixtos. En el capítulo 15 se destaca la 
aplicación de los diseños con dos niveles en el contexto de los experimentos factoriales 
fraccionarios y completos (2*). También se ejemplifican los diseños especiales de selec- 
ción. En el capítulo 15 se incluye asimismo una nueva sección sobre la metodología de 
superficie de respuesta (MSR), para ejemplificar el uso del diseño experimental con la 
finalidad de encontrar condiciones óptimas de proceso. Se analiza el ajuste de un modelo 
de segundo orden utilizando un diseño complejo central. La MSR se amplía para abarcar 
el análisis de problemas sobre el diseño de un parámetro robusto. Las variables de ruido 
se utilizan para ajustar modelos dobles de superficie de respuesta. Los capítulos 16, 17 y 
18 incluyen una cantidad moderada de material sobre estadística no paramétrica, control 
de calidad e inferencia bayesiana. 

El capítulo 1 es un bosquejo de la inferencia estadística, presentada a un nivel ma- 
temático sencillo, pero de manera más amplia que en la octava edición con el propósito 
de examinar más detalladamente los estadísticos de una sola cifra y las técnicas gráficas. 
Este capítulo está diseñado para brindar a los estudiantes una presentación preliminar de 
los conceptos fundamentales que les permitirán entender los detalles posteriores de mayor 
complejidad. Se presentan conceptos clave sobre muestreo, recolección de datos y diseño 
experimental, así como los aspectos rudimentarios de las herramientas gráficas y la infor- 
mación que se obtiene a partir de un conjunto de datos. También se agregaron las gráficas 
de tallo y hojas, y las de caja y bigotes. Las gráficas están mejor organizadas y etique- 
tadas. El análisis de la incertidumbre y la variación en un sistema se ilustra de forma 
detallada. Se incluyen ejemplos de cómo clasificar las características importantes de un 
sistema о proceso científico, y esas ideas se ilustran en ambientes prácticos, como procesos 
de manufactura, estudios biomédicos, y estudios de sistemas biológicos y científicos de 
otros tipos. Se efectúa una comparación entre el uso de los datos discretos y continuos; 
también se hace un mayor énfasis en el uso de modelos y de la información con respecto a 
los modelos estadísticos que se logran obtener mediante las herramientas gráficas. 

En los capítulos 2, 3 y 4 se estudian los conceptos básicos de probabilidad, así como 
las variables aleatorias discretas y continuas. Los capítulos 5 y 6 se enfocan en las distri- 
buciones discretas y continuas específicas, así como en las relaciones que existen entre 
ellas. En estos capítulos también se destacan ejemplos de aplicaciones de las distribucio- 
nes en estudios reales científicos y de ingeniería. Los estudios de caso, los ejemplos y 
una gran cantidad de ejercicios permiten a los estudiantes practicar el uso de tales distri- 
buciones. Los proyectos permiten la aplicación práctica de estas distribuciones en la vida 
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real mediante el trabajo en equipo. El capítulo 7 es el más teórico del libro; en él se ex- 
pone la transformación de variables aleatorias, y podría ser que no se utilice a menos que 
el instructor desee impartir un curso relativamente teórico. El capítulo 8 contiene mate- 
rial gráfico, el cual amplía el conjunto básico de herramientas gráficas presentadas y 
ejemplificadas en el capítulo 1. Aquí se analizan las gráficas de probabilidad y se ilustran 
con ejemplos. El muy importante concepto de las distribuciones de muestreo se presenta 
de forma detallada, y se proporcionan ejemplos que incluyen el teorema del límite central 
y la distribución de una varianza muestral en una situación de muestreo independiente y 
normal. También se presentan las distribuciones £ y F para motivar a los estudiantes a 
utilizarlas en los capítulos posteriores. El nuevo material del capítulo 8 ayuda a los estu- 
diantes a conocer la importancia de la prueba de hipótesis mediante la presentación del 
concepto del valor P. 

El capítulo 9 contiene material sobre la estimación puntual y de intervalos de una 
muestra y dos muestras. Un análisis detallado y con ejemplos destaca las diferencias 
entre los tipos de intervalos (intervalos de confianza, intervalos de predicción e interva- 
los de tolerancia). Un estudio de caso ilustra los tres tipos de intervalos estadísticos en el 
contexto de una situación de manufactura. Este estudio de caso destaca las diferencias 
entre los intervalos, sus fuentes y los supuestos en que se basan, así como cuáles son los 
intervalos que requieren diferentes tipos de estudios o preguntas. Se añadió un método 
de aproximación para las inferencias sobre una proporción. El capítulo 10 inicia con una 
presentación básica sobre el significado práctico de la prueba de hipótesis, con un énfasis 
en conceptos fundamentales como la hipótesis nula y la alternativa, el papel que desem- 
peñan la probabilidad y el valor P, así como la potencia de una prueba. Después, se 
presentan ejemplos de pruebas sobre una o dos muestras en condiciones estándar. Tam- 
bién se describe la prueba г de dos muestras con observaciones en pares (apareadas). Un 
estudio de caso ayuda a los estudiantes a entender el verdadero significado de una inte- 
racción de factores, así como los problemas que en ocasiones surgen cuando existen in- 
teracciones entre tratamientos y unidades experimentales. Al final del capítulo 10 se 
incluye una sección muy importante que relaciona los capítulos 9 y 10 (estimación y 
prueba de hipótesis) con los capítulos 11 a 16, donde se destaca el modelamiento esta- 
dístico. Es importante que el estudiante esté consciente de la fuerte relación entre los 
capítulos mencionados. 

Los capítulos 11 y 12 incluyen material sobre la regresión lineal simple y múltiple, 
respectivamente. En esta edición ponemos mucho más atención en el efecto que tiene 
la colinealidad entre las variables de regresión. Se presenta una situación que muestra 
cómo el papel que desempeña una sola variable de regresión depende en gran parte de 
cuáles son los regresores que la acompañan en el modelo. Después se revisan los proce- 
dimientos secuenciales para la selección del modelo (hacia adelante, hacia atrás, por 
etapas, etcétera) con respecto a este concepto, así como los fundamentos para utilizar 
ciertos tipos de valores P con tales procedimientos. En el capítulo 12 se estudia material 
sobre los modelos no lineales con una presentación especial de la regresión logística, la 
cual tiene aplicaciones en ingeniería y en las ciencias biológicas. El material sobre la re- 
gresión múltiple es muy extenso, de manera que, como antes se expuso, plantea una gran 
flexibilidad. Al final del capítulo 12 se incluye un comentario que lo relaciona con los 
capítulos 14 y 15. Se agregaron varios elementos para fomentar la comprensión del ma- 
terial en general. Por ejemplo, al final del capítulo se describen algunas dificultades y 
problemas que podrían surgir. Se indica que existen tipos de respuestas que ocurren de 
forma natural en la práctica, por ejemplo, respuestas de proporciones, de conteo y mu- 
chas otras, con las cuales no se debe utilizar la regresión estándar de mínimos cuadrados 
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debido a que los supuestos de normalidad no se cumplen, y transgredirlos causaría erro- 
res muy graves. Se sugiere utilizar la transformación de datos para reducir el problema 
en algunos casos. Nuevamente, los capítulos 13 y 14 sobre el tema del análisis de varian- 
za tienen cierta flexibilidad. En el capítulo 13 se estudia el ANOVA de un factor en el 
contexto de un diseño completamente aleatorio. Algunos temas complementarios incluyen 
las pruebas sobre las varianzas y las comparaciones múltiples. Se destacan las compara- 
ciones de tratamientos en bloque, junto con el tema de los bloques completos aleatoriza- 
dos. Los métodos gráficos se extendieron al ANOVA para ayudar al estudiante a 
complementar la inferencia formal con una inferencia pictórica que facilita la presenta- 
ción del material a los científicos y a los ingenieros. Se incluye un nuevo proyecto donde 
los estudiantes incorporan la aleatoriedad adecuada a cada plan, y se utilizan técnicas 
gráficas y valores P en el informe de los resultados. En el capítulo 14 se amplía el mate- 
rial del capítulo 13 para ajustar dos o más factores dentro de una estructura factorial. La 
presentación del ANOVA en el capítulo 14 incluye la creación de modelos aleatorios y 
de efectos fijos. En el capítulo 15 se estudia material relacionado con los diseños facto- 
riales 2%; los ejemplos y los estudios de caso plantean el uso de diseños de selección y 
fracciones especiales de orden superior del factorial 2“. Dos elementos nuevos y espe- 
ciales son la metodología de superficie de respuesta (MSR) y el diseño de parámetros 
robustos. Son temas que se relacionan en un estudio de caso que describe e ilustra un 
diseño doble de superficie de respuesta, así como un análisis que incluye el uso de super- 
ficies de respuesta de la media y la varianza de procesos. 


Programa de cómputo 


Los estudios de caso, que inician en el capítulo 8, muestran impresiones de listas de 
resultados por computadora y material gráfico generado con los programas SAS y 
MINITAB. El hecho de incluir los cálculos por computadora refleja nuestra idea de que 
los estudiantes deben contar con la experiencia de leer e interpretar impresiones de listas 
de resultados y gráficas por computadora, incluso si el software que se utiliza en el libro 
no coincide con el que utiliza el profesor. La exposición a más de un tipo de programas 
aumentaría la experiencia de los estudiantes. No hay razones para creer que el progra- 
ma utilizado en el curso coincidirá con el que el estudiante tendrá que utilizar en la 
práctica después de graduarse. Cuando sea pertinente, los ejemplos y los estudios de 
caso en el libro se complementarán con diversos tipos de gráficas residuales, cuantilares, 
de probabilidad normal y de otros tipos. Tales gráficas se incluyen especialmente en los 
capítulos 11 a 15. 


Complementos 


Manual de soluciones para el instructor. Este recurso contiene respuestas a todos los 
ejercicios del libro y se puede descargar del Centro de Recursos para Profesor de Pearson. 


Diapositivas de PowerPoint” ISBN-10: 0-321-73731-8; ISBN-13: 978-0-321-73731-1. 
Las diapositivas incluyen la mayoría de las figuras y las tablas del libro; se pueden des- 
cargar del Centro de Recursos para el Profesor de Pearson. 
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CAPÍTULO 1 


Introducción a la estadística 
y al análisis de datos 


1.1 Panorama general: inferencia estadística, muestras, poblaciones 
y el papel de la probabilidad 


Desde inicios de la década de los ochenta del siglo pasado y hasta lo que ha transcurrido 
del siglo XxI la industria estadounidense ha puesto una enorme atención en el mejora- 
miento de la calidad. Se ha dicho y escrito mucho acerca del “milagro industrial” en 
Japón, que comenzó a mediados del siglo xx. Los japoneses lograron el éxito en donde 
otras naciones fallaron, a saber, en la creación de un entorno que permita la manufactura 
de productos de alta calidad. Gran parte del éxito de los japoneses se atribuye al uso de 
métodos estadísticos y del pensamiento estadístico entre el personal gerencial. 


Empleo de datos científicos 


El uso de métodos estadísticos en la manufactura, el desarrollo de productos alimenti- 
cios, el software para computadoras, las fuentes de energía, los productos farmacéuticos 
y muchas otras áreas implican el acopio de información o datos científicos. Por su- 
puesto que la obtención de datos no es algo nuevo, ya que se ha realizado por más de mil 
años. Los datos se han recabado, resumido, reportado y almacenado para su examen 
cuidadoso. Sin embargo, hay una diferencia profunda entre el acopio de información 
científica y la estadística inferencial. Esta última ha recibido atención legítima en déca- 
das recientes. 

La estadística inferencial generó un número enorme de “herramientas” de los méto- 
dos estadísticos que utilizan los profesionales de la estadística. Los métodos estadísticos 
se diseñan para contribuir al proceso de realizar juicios científicos frente a la incerti- 
dumbre y a la variación. Dentro del proceso de manufactura, la densidad de producto de 
un material específico no siempre será la misma. De hecho, si un proceso es discontinuo 
en vez de continuo, la densidad de material no sólo variará entre los lotes que salen de la 
línea de producción (variación de un lote a otro), sino también dentro de los propios lo- 
tes. Los métodos estadísticos se utilizan para analizar datos de procesos como el anterior; 
el objetivo de esto es tener una mejor orientación respecto de cuáles cambios se deben 
realizar en el proceso para mejorar su calidad. En este proceso la calidad bien podría 
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definirse en relación con su grado de acercamiento a un valor de densidad meta en armo- 
nía con qué parte de las veces se cumple este criterio de cercanía. A un ingeniero podría 
interesarle un instrumento específico que se utilice para medir el monóxido de azufre en 
estudios sobre la contaminación atmosférica. Si el ingeniero dudara respecto de la efica- 
cia del instrumento, tendría que tomar en cuenta dos fuentes de variación. La primera 
es la variación en los valores del monóxido de azufre que se encuentran en el mismo 
lugar el mismo día. La segunda es la variación entre los valores observados y la cantidad 
real de monóxido de azufre que haya en el aire en ese momento. Si cualquiera de estas 
dos fuentes de variación es excesivamente grande (según algún estándar determinado 
por el ingeniero), quizá se necesite remplazar el instrumento. En un estudio biomédico 
de un nuevo fármaco que reduce la hipertensión, 85% de los pacientes experimentaron 
alivio; aunque por lo general se reconoce que el medicamento actual o el “viejo” alivia 
a 80% de los pacientes que sufren hipertensión crónica. Sin embargo, el nuevo fármaco 
es más caro de elaborar y podría tener algunos efectos colaterales. ¿Se debería adoptar 
el nuevo medicamento? Éste es un problema con el que las empresas farmacéuticas, 
junto con la FDA (Federal Drug Administration), se encuentran a menudo (a veces es 
mucho más complejo). De nuevo se debe tomar en cuenta las necesidades de variación. 
El valor del “85%” se basa en cierto número de pacientes seleccionados para el estudio. 
Tal vez si se repitiera el estudio con nuevos pacientes ¡el número observado de “éxitos” 
sería de 75%! Se trata de una variación natural de un estudio a otro que se debe tomar en 
cuenta en el proceso de toma de decisiones. Es evidente que tal variación es importante, 
ya que la variación de un paciente a otro es endémica al problema. 


Variabilidad en los datos científicos 


En los problemas analizados anteriormente los métodos estadísticos empleados tienen 
que ver con la variabilidad y en cada caso la variabilidad que se estudia se encuentra 
en datos científicos. Si la densidad del producto observada en el proceso fuera siempre 
la misma y siempre fuera la esperada, no habría necesidad de métodos estadísticos. Si el 
dispositivo para medir el monóxido de azufre siempre diera el mismo valor y éste fuera 
exacto (es decir, correcto), no se requeriría análisis estadístico. Si entre un paciente y 
otro no hubiera variabilidad inherente a la respuesta al medicamento (es decir, si el fár- 
maco siempre causara alivio o nunca aliviara), la vida sería muy sencilla para los cientí- 
ficos de las empresas farmacéuticas y de la FDA, y los estadísticos no serían necesarios 
en el proceso de toma de decisiones. Los investigadores de la estadística han originado 
un gran número de métodos analíticos que permiten efectuar análisis de datos obtenidos 
de sistemas como los descritos anteriormente, lo cual refleja la verdadera naturaleza de 
la ciencia que conocemos como estadística inferencial, a saber, el uso de técnicas que, al 
permitirnos obtener conclusiones (o inferencias) sobre el sistema científico, nos permiten 
ir más allá de sólo reportar datos. Los profesionales de la estadística usan leyes funda- 
mentales de probabilidad e inferencia estadística para sacar conclusiones respecto de los 
sistemas científicos. La información se colecta en forma de muestras o conjuntos de 
observaciones. En el capítulo 2 se introduce el proceso de muestreo, el cual se continúa 
analizando a lo largo de todo el libro. 

Las muestras se reúnen a partir de poblaciones, que son conjuntos de todos los indivi- 
duos o elementos individuales de un tipo específico. А veces una población representa un 
sistema científico. Por ejemplo, un fabricante de tarjetas para computadora podría desear 
eliminar defectos. Un proceso de muestreo implicaría recolectar información de 50 tarje- 
tas de computadora tomadas aleatoriamente durante el proceso. En este caso la población 
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sería representada por todas las tarjetas de computadora producidas por la empresa en un 
periodo específico. Si se lograra mejorar el proceso de producción de las tarjetas para 
computadora y se reuniera una segunda muestra de tarjetas, cualquier conclusión que se 
obtuviera respecto de la efectividad del cambio en el proceso debería extenderse a toda la 
población de tarjetas para computadora que se produzcan en el “proceso mejorado”. En 
un experimento con fármacos se toma una muestra de pacientes y a cada uno se le admi- 
nistra un medicamento específico para reducir la presión sanguínea. El interés se enfoca 
en obtener conclusiones sobre la población de quienes sufren hipertensión. A menudo, 
cuando la planeación ocupa un lugar importante en la agenda, es muy importante el acopio 
de datos científicos en forma sistemática. En ocasiones la planeación está, por necesidad, 
bastante limitada. Con frecuencia nos enfocamos en ciertas propiedades o características 
de los elementos u objetos de la población. Cada característica tiene importancia de inge- 
niería específica о, digamos, biológica para el “cliente”, el científico o el ingeniero que 
busca aprender algo acerca de la población. Por ejemplo, en uno de los casos anteriores 
la calidad del proceso se relacionaba con la densidad del producto al salir del proceso. 
Un(a) ingeniero(a) podría necesitar estudiar el efecto de las condiciones del proceso, la 
temperatura, la humedad, la cantidad de un ingrediente particular, etcétera. Con ese fin 
podría mover de manera sistemática estos factores a cualesquiera niveles que se sugie- 
ran, de acuerdo con cualquier prescripción o diseño experimental que se desee. Sin 
embargo, un científico silvicultor que está interesado en estudiar los factores que influyen 
en la densidad de la madera en cierta clase de árbol no necesariamente tiene que diseñar 
un experimento. Este caso quizá requiera un estudio observacional, en el cual los datos 
se acopian en el campo pero no es posible seleccionar de antemano los niveles de los 
factores. Ambos tipos de estudio se prestan a los métodos de la inferencia estadística. En 
el primero, la calidad de las inferencias dependerá de la planeación adecuada del experi- 
mento. En el segundo, el científico está a expensas de lo que pueda recopilar. Por ejemplo, 
si un agrónomo se interesara en estudiar el efecto de la lluvia sobre la producción de 
plantas sería lamentable que recopilara los datos durante una sequía. 

Es bien conocida la importancia del pensamiento estadístico para los administrado- 
res y el uso de la inferencia estadística para el personal científico. Los investigadores 
obtienen mucho de los datos científicos. Los datos proveen conocimiento acerca del fe- 
nómeno científico. Los ingenieros de producto y de procesos aprenden más en sus es- 
fuerzos fuera de línea para mejorar el proceso. También logran una comprensión valiosa 
al reunir datos de producción (supervisión en línea) sobre una base regular, lo cual les 
permite determinar las modificaciones que se requiere realizar para mantener el proceso 
en el nivel de calidad deseado. 

En ocasiones un científico sólo desea obtener alguna clase de resumen de un con- 
junto de datos representados en la muestra. En otras palabras, no requiere estadística 
inferencial. En cambio, le sería útil un conjunto de estadísticos o la estadística descrip- 
tiva. Tales números ofrecen un sentido de la ubicación del centro de los datos, de la va- 
riabilidad en los datos y de la naturaleza general de la distribución de observaciones en 
la muestra. Aunque no se incorporen métodos estadísticos específicos que lleven a la 
inferencia estadística, se puede aprender mucho. A veces la estadística descriptiva va 
acompañada de gráficas. El software estadístico moderno permite el cálculo de medias, 
medianas, desviaciones estándar y otros estadísticos de una sola cifra, así como el 
desarrollo de gráficas que presenten una “huella digital” de la naturaleza de la muestra. 
En las secciones siguientes veremos definiciones e ilustraciones de los estadísticos y 
descripciones de recursos gráficos como histogramas, diagramas de tallo y hojas, diagra- 
mas de dispersión, gráficas de puntos y diagramas de caja. 
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El papel de la probabilidad 


En los capítulos 2 a 6 de este libro se presentan los conceptos fundamentales de la pro- 
babilidad. Un estudio concienzudo de las bases de tales conceptos permitirá al lector 
comprender mejor la inferencia estadística. Sin algo de formalismo en teoría de proba- 
bilidad, el estudiante no podría apreciar la verdadera interpretación del análisis de datos 
a través de los métodos estadísticos modernos. Es muy natural estudiar probabilidad 
antes de estudiar inferencia estadística. Los elementos de probabilidad nos permiten 
cuantificar la fortaleza o “confianza” en nuestras conclusiones. En este sentido, los con- 
ceptos de probabilidad forman un componente significativo que complementa los mé- 
todos estadísticos y ayuda a evaluar la consistencia de la inferencia estadística. Por 
consiguiente, la disciplina de la probabilidad brinda la transición entre la estadística 
descriptiva y los métodos inferenciales. Los elementos de la probabilidad permiten ex- 
presar la conclusión en el lenguaje que requieren los científicos y los ingenieros. El 
ejemplo que sigue permite al lector comprender la noción de un valor-P, el cual a menudo 
proporciona el “fundamento” en la interpretación de los resultados a partir del uso de 
métodos estadísticos. 


Ejemplo 1.1: | Suponga que un ingeniero se encuentra con datos de un proceso de producción en el cual 
se muestrean 100 artículos y se obtienen 10 defectuosos. Se espera y se anticipa que 
ocasionalmente habrá artículos defectuosos. Obviamente estos 100 artículos representan 
la muestra. Sin embargo, se determina que, a largo plazo, la empresa sólo puede tolerar 
5% de artículos defectuosos en el proceso. Ahora bien, los elementos de probabilidad 
permiten al ingeniero determinar qué tan concluyente es la información muestral respec- 
to de la naturaleza del proceso. En este caso la población representa conceptualmente 
todos los artículos posibles en el proceso. Suponga que averiguamos que, si el proceso 
es aceptable, es decir, que su producción no excede un 5% de artículos defectuosos, hay 
una probabilidad de 0.0282 de obtener 10 o más artículos defectuosos en una muestra 
aleatoria de 100 artículos del proceso. Esta pequeña probabilidad sugiere que, en reali- 
dad, a largo plazo el proceso tiene un porcentaje de artículos defectuosos mayor al 5%. 
En otras palabras, en las condiciones de un proceso aceptable casi nunca se obtendría la 
información muestral que se obtuvo. Sin embargo, ¡se obtuvo! Por lo tanto, es evidente 
que la probabilidad de que se obtuviera sería mucho mayor si la tasa de artículos defec- 
tuosos del proceso fuera mucho mayor que 5%. J 

A partir de este ejemplo se vuelve evidente que los elementos de probabilidad ayu- 
dan a traducir la información muestral en algo concluyente o no concluyente acerca del 
sistema científico. De hecho, lo aprendido probablemente constituya información in- 
quietante para el ingeniero o administrador. Los métodos estadísticos (que examinare- 
mos con más detalle en el capítulo 10) produjeron un valor-P de 0.0282, El resultado 
sugiere que es muy probable que el proceso no sea aceptable. En los capítulos si- 
guientes se trata detenidamente el concepto de valor-P. El próximo ejemplo brinda una 
segunda ilustración. 


Ejemplo 1.2: | Соп frecuencia, la naturaleza del estudio científico señalará el papel que desempeñan la 
probabilidad y el razonamiento deductivo en la inferencia estadística. El ejercicio 9.40 
en la página 294 proporciona datos asociados con un estudio que se llevó a cabo en el 
Virginia Polytechnic Institute and State University acerca del desarrollo de una relación 
entre las raíces de los árboles y la acción de un hongo. Los minerales de los hongos se 
transfieren a los árboles, y los azúcares de los árboles a los hongos. Se plantaron dos 
muestras de 10 plantones de roble rojo norteño en un invernadero, una de ellas contenía 
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plantones tratados con nitrógeno y la otra plantones sin tratamiento. Todas las demás 
condiciones ambientales se mantuvieron constantes. Todos los plantones contenían el 
hongo Pisolithus tinctorus. En el capítulo 9 se incluyen más detalles. Los pesos en 
gramos de los tallos se registraron después de 140 días y los datos se presentan en la 
tabla 1.1. 


Tabla 1.1: Conjunto de datos del ejemplo 1.2 


Sin nitrógeno Con nitrógeno 


0.32 0.26 
0.53 0.43 
0.28 0.47 
0.37 0.49 
0.47 0.52 
0.43 0.75 
0.36 0.79 
0.42 0.86 
0.38 0.62 
0.43 0.46 


0.30 035 040 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 


Figura 1.1: Gráfica de puntos de los datos de peso del tallo. 


En este ejemplo hay dos muestras tomadas de dos poblaciones distintas. El objeti- 
vo del experimento es determinar si el uso del nitrógeno influye en el crecimiento de las 
raíces. Éste es un estudio comparativo (es decir, es un estudio en el que se busca comparar 
las dos poblaciones en cuanto a ciertas características importantes). Los datos se deben 
graficar como se indica en el diagrama de puntos de la figura 1.1. Los valores o represen- 
tan los datos “con nitrógeno” y los valores x los datos “sin nitrógeno”. 

Observe que la apariencia general de los datos podría sugerir al lector que, en pro- 
medio, el uso del nitrógeno aumenta el peso del tallo. Cuatro observaciones con nitróge- 
no son considerablemente más grandes que cualquiera de las observaciones sin nitrógeno. 
La mayoría de las observaciones sin nitrógeno parece estar por debajo del centro de los 
datos. La apariencia del conjunto de datos parece indicar que el nitrógeno es efectivo. 
Pero, ¿cómo se cuantifica esto? ¿Cómo se puede resumir toda la evidencia visual aparente 
de manera que tenga algún significado? Como en el ejemplo anterior, se pueden utilizar 
los fundamentos de la probabilidad. Las conclusiones se resumen en una declaración 
de probabilidad o valor-P. Aquí no demostraremos la inferencia estadística que produce 
la probabilidad resumida. Igual que en el ejemplo 1.1, tales métodos se estudiarán en el 
capítulo 10. El problema gira alrededor de la “probabilidad de que datos como éstos se 
puedan observar”, dado que el nitrógeno no tiene efecto; en otras palabras, dado que 
ambas muestras se generaron a partir de la misma población. Suponga que esta probabi- 
lidad es pequeña, digamos de 0.03; un porcentaje que podría constituir suficiente eviden- 
cia de que el uso del nitrógeno en realidad influye en el peso promedio del tallo en los 
plantones de roble rojo (aparentemente lo aumenta). JJ 
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¿Cómo trabajan juntas la probabilidad y la inferencia estadística? 


Es importante para el lector que comprenda claramente la diferencia entre la disciplina 
de la probabilidad, una ciencia por derecho propio, y la disciplina de la estadística infe- 
rencial. Como señalamos, el uso o la aplicación de conceptos de probabilidad permite 
interpretar la vida cotidiana a partir de los resultados de la inferencia estadística. En 
consecuencia, se afirma que la inferencia estadística emplea los conceptos de probabili- 
dad. A partir de los dos ejemplos anteriores aprendimos que la información muestral está 
disponible para el analista y que, con la ayuda de métodos estadísticos y elementos de 
probabilidad, podemos obtener conclusiones acerca de alguna característica de la pobla- 
ción (en el ejemplo 1.1 el proceso al parecer no es aceptable, y en el ejemplo 1.2 parece 
ser que el nitrógeno en verdad influye en el peso promedio de los tallos). Así, para un 
problema estadístico, la muestra, junto con la estadística inferencial, nos permite 
obtener conclusiones acerca de la población, ya que la estadística inferencial utiliza 
ampliamente los elementos de probabilidad. Tal razonamiento es inductivo por natu- 
raleza. Ahora, cuando avancemos al capítulo 2 y los siguientes, el lector encontrará que, 
a diferencia de lo que hicimos en nuestros dos ejemplos actuales, no nos enfocaremos en 
resolver problemas estadísticos. En muchos de los ejemplos que estudiaremos no utili- 
zaremos muestras. Lo que haremos será describir claramente una población con todas 
sus características conocidas. Las preguntas importantes se enfocarán en la naturaleza de 
los datos que hipotéticamente se podrían obtener a partir de la población. Entonces, po- 
dríamos afirmar que los elementos de probabilidad nos permiten sacar conclusiones 
acerca de las características de los datos hipotéticos que se tomen de la población, 
con base en las características conocidas de la población. Esta clase de razonamiento 
es deductivo por naturaleza. La figura 1.2 muestra la relación básica entre la probabilidad 
y la estadística inferencial. 


Probabilidad 


Población Muestra 


Inferencia estadística 


Figura 1.2: Relación básica entre la probabilidad y la estadística inferencial. 


Ahora bien, en términos generales, ¿cuál campo es más importante, el de la proba- 
bilidad o el de la estadística? Ambos son muy importantes y evidentemente se comple- 
mentan. La única certeza respecto de la didáctica de ambas disciplinas radica en el hecho 
de que, si la estadística se debe enseñar con un nivel mayor al de un simple “libro de 
cocina”, entonces hay que comenzar por enseñar la disciplina de la probabilidad. Esta 
regla se basa en el hecho de que un analista no podrá aprender nada sobre una población 
a partir de una muestra hasta que aprenda los rudimentos de incertidumbre en esa muestra. 
Considere el ejemplo 1.1; en el que la pregunta se centra en si la población, definida 
por el proceso, tiene o no más de 5% de elementos defectuosos. En otras palabras, la 
suposición es que 5 de cada 100 artículos, en promedio, salen defectuosos. Ahora bien, 
la muestra contiene 100 artículos y 10 están defectuosos. ¿Esto apoya o refuta la supo- 
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sición? Aparentemente la refuta porque 10 artículos de cada 100 parecen ser “un trozo 
grande”. ¿Pero cómo podríamos saber esto sin tener nociones de probabilidad? La única 
manera en que podremos aprender las condiciones en las cuales el proceso es aceptable 
(5% de defectuosos) es estudiando el material de los siguientes capítulos. La probabilidad 
de obtener 10 o más artículos defectuosos en una muestra de 100 es de 0.0282. 

Dimos dos ejemplos en donde los elementos de probabilidad ofrecen un resumen 
que el científico o el ingeniero pueden usar como evidencia para basar una decisión. El 
puente entre los datos y la conclusión está, por supuesto, basado en los fundamentos de 
la inferencia estadística, la teoría de la distribución y las distribuciones de muestreos que 
se examinarán en capítulos posteriores. 


1.2 Procedimientos de muestreo; recolección de los datos 


En la sección 1.1 estudiamos muy brevemente el concepto de muestreo y el proceso de 
muestreo. Aunque el muestreo parece ser un concepto simple, la complejidad de las 
preguntas que se deben contestar acerca de la población, o las poblaciones, en ocasiones 
requiere que el proceso de muestreo sea muy complejo. El concepto de muestreo se 
examinará de manera técnica en el capítulo 8, pero aquí nos esforzaremos por dar algu- 
nas nociones de sentido común sobre el muestreo. Ésta es una transición natural hacia el 
análisis del concepto de variabilidad. 


Muestreo aleatorio simple 


La importancia del muestreo adecuado gira en torno al grado de confianza con que el 
analista es capaz de responder las preguntas que se plantean. Supongamos que sólo hay 
una población en el problema. Recuerde que en el ejemplo 1.2 había dos poblaciones 
implicadas. El muestreo aleatorio simple significa que cierta muestra dada de un tamaño 
muestral específico tiene la misma probabilidad de ser seleccionada que cualquiera 
otra muestra del mismo tamaño. El término tamaño muestral simplemente indica el 
número de elementos en la muestra. Evidentemente, en muchos casos se puede utilizar 
una tabla de números aleatorios para seleccionar la muestra. La ventaja del muestreo 
aleatorio simple radica en que ayuda a eliminar el problema de tener una muestra que 
refleje una población diferente (quizá más restringida) de aquella sobre la cual se nece- 
sitan realizar las inferencias. Por ejemplo, se elige una muestra para contestar diferentes 
preguntas respecto de las preferencias políticas en cierta entidad de Estados Unidos. La 
muestra implica la elección de, digamos, 1000 familias y una encuesta a aplicar. Ahora 
bien, suponga que no se utiliza el muestreo aleatorio, sino que todas o casi todas las 
1000 familias se eligen de una zona urbana. Se considera que las preferencias políticas en 
las áreas rurales difieren de las de las áreas urbanas. En otras palabras, la muestra obte- 
nida en realidad confinó a la población y, por lo tanto, las inferencias también se tendrán 
que restringir a la “población confinada”, y en este caso el confinamiento podría resultar 
indeseable. Si, de hecho, se necesitara hacer las inferencias respecto de la entidad como 
un todo, a menudo se diría que la muestra con un tamaño de 1000 familias aquí descrita 
es una muestra sesgada. 

Como antes sugerimos, el muestreo aleatorio simple no siempre es adecuado. El 
enfoque alternativo que se utilice dependerá de la complejidad del problema. Con frecuen- 
cia, por ejemplo, las unidades muestrales no son homogéneas y se dividen naturalmente 
en grupos que no se traslapan y que son homogéneos. Tales grupos se llaman estratos, y 
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un procedimiento llamado muestreo aleatorio estratificado implica la selección al azar 
de una muestra dentro de cada estrato. El propósito de esto es asegurarse de que ningu- 
no de los estratos esté sobrerrepresentado ni subrepresentado. Por ejemplo, suponga que 
se aplica una encuesta a una muestra para reunir opiniones preliminares respecto de un 
referéndum que se piensa realizar en determinada ciudad. La ciudad está subdividida en 
varios grupos étnicos que representan estratos naturales y, para no excluir ni sobrerrepre- 
sentar a algún grupo de cada uno de ellos, se eligen muestras aleatorias separadas de 
cada grupo. 


Diseño experimental 


El concepto de aleatoriedad o asignación aleatoria desempeña un papel muy importante 
en el área del diseño experimental, que se presentó brevemente en la sección 1.1 y es 
un fundamento muy importante en casi cualquier área de la ingeniería y de la ciencia 
experimental. Estudiaremos este tema con detenimiento en los capítulos 13 a 15. Sin 
embargo, es conveniente introducirlo aquí brevemente en el contexto del muestreo alea- 
torio. Un conjunto de los llamados tratamientos o combinaciones de tratamientos se 
vuelven las poblaciones que se van a estudiar o a comparar en algún sentido. Un ejem- 
plo es el tratamiento “con nitrógeno” versus “sin nitrógeno” del ejemplo 1.2. Otro ejemplo 
sencillo sería “placebo” versus “medicamento activo” o, en un estudio sobre la fatiga por 
corrosión, tendríamos combinaciones de tratamientos que impliquen especímenes con 
recubrimiento o sin recubrimiento, así como condiciones de alta o de baja humedad, a 
las cuales se somete el espécimen. De hecho, habrían cuatro combinaciones de factores 
o de tratamientos (es decir, 4 poblaciones), y se podrían formular y responder muchas 
preguntas científicas usando los métodos estadísticos e inferenciales. Considere primero 
la situación del ejemplo 1.2. En el experimento hay 20 plantones enfermos implicados. 
A partir de los datos es fácil observar que los plantones son diferentes entre sí. Dentro 
del grupo tratado con nitrógeno (o del grupo que no se trató con nitrógeno) hay variabi- 
lidad considerable en el peso de los tallos, la cual se debe a lo que por lo general se de- 
nomina unidad experimental. Éste es un concepto tan importante en la estadística infe- 
rencial que no es posible describirlo totalmente en este capítulo. La naturaleza de la 
variabilidad es muy importante. Si es demasiado grande, debido a que resulta de una 
condición de excesiva falta de homogeneidad en las unidades experimentales, la variabi- 
lidad “eliminará” cualquier diferencia detectable entre ambas poblaciones. Recuerde 
que en este caso eso no ocurrió. 

La gráfica de puntos de la figura 1.1 y el valor-P indican una clara distinción entre 
esas dos condiciones. ¿Qué papel desempeñan tales unidades experimentales en el pro- 
ceso mismo de recolección de los datos? El enfoque por sentido común y, de hecho, es- 
tándar, es asignar los 20 plantones o unidades experimentales aleatoriamente a las dos 
condiciones o tratamientos. En el estudio del medicamento podríamos decidir utilizar 
un total de 200 pacientes disponibles, quienes serán claramente distinguibles en algún 
sentido. Ellos son las unidades experimentales. No obstante, tal vez todos tengan una 
condición crónica que podría ser tratada con el fármaco. Así, en el denominado diseño 
completamente aleatorio, se asignan al azar 100 pacientes al placebo y 100 al medica- 
mento activo. De nuevo, son estas unidades experimentales en el grupo o tratamiento las 
que producen la variabilidad en el resultado de los datos (es decir, la variabilidad en el 
resultado medido), digamos, de la presión sanguínea o cualquier valor de la eficacia de 
un medicamento que sea importante. En el estudio de la fatiga por corrosión las unidades 
experimentales son los especímenes que se someten a la corrosión. 
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¿Por qué las unidades experimentales se asignan aleatoriamente? 


¿Cuál es el posible efecto negativo de no asignar aleatoriamente las unidades experi- 
mentales a los tratamientos o a las combinaciones de tratamientos? Esto se observa más 
claramente en el caso del estudio del medicamento. Entre las características de los pa- 
cientes que producen variabilidad en los resultados están la edad, el género y el peso. 
Tan sólo suponga que por casualidad el grupo del placebo contiene una muestra de 
personas que son predominantemente más obesas que las del grupo del tratamiento. 
Quizá los individuos más obesos muestren una tendencia a tener una presión sanguínea 
más elevada, lo cual evidentemente sesgará el resultado y, por lo tanto, cualquier resul- 
tado que se obtenga al aplicar la inferencia estadística podría tener poco que ver con el 
efecto del medicamento, pero mucho con las diferencias en el peso de ambas muestras 
de pacientes. 

Deberíamos enfatizar la importancia del término variabilidad. La variabilidad ex- 
cesiva entre las unidades experimentales “disfraza” los hallazgos científicos. En seccio- 
nes posteriores intentaremos clasificar y cuantificar las medidas de variabilidad. En las 
siguientes secciones presentaremos y analizaremos cantidades específicas que se calcu- 
lan en las muestras; las cantidades proporcionan una idea de la naturaleza de la muestra 
respecto de la ubicación del centro de los datos y la variabilidad de los mismos. Un aná- 
lisis de varias de tales medidas de un solo número permite ofrecer un preámbulo de que 
la información estadística será un componente importante de los métodos estadísticos 
que se utilizarán en capítulos posteriores. Estas medidas, que ayudan a clasificar la natu- 
raleza del conjunto de datos, caen en la categoría de estadísticas descriptivas. Este 
material es una introducción a una presentación breve de los métodos pictóricos y grá- 
ficos que van incluso más allá en la caracterización del conjunto de datos. El lector de- 
bería entender que los métodos estadísticos que se presentan aquí se utilizarán a lo largo 
de todo el texto. Para ofrecer una imagen más clara de lo que implican los estudios de 
diseño experimental se presenta el ejemplo 1.3. 


Se realizó un estudio sobre la corrosión con la finalidad de determinar si al recubrir una 
aleación de aluminio con una sustancia retardadora de la corrosión, el metal se corroe 
menos. El recubrimiento es un protector que los anunciantes afirman que minimiza el 
daño por fatiga en esta clase de material. La influencia de la humedad sobre la magnitud 
de la corrosión también es de interés. Una medición de la corrosión puede expresarse en 
millares de ciclos hasta la ruptura del metal. Se utilizaron dos niveles de recubrimiento: 
sin recubrimiento y con recubrimiento químico contra la corrosión. También se conside- 
raron dos niveles de humedad relativa, de 20% y 80%, respectivamente. 

El experimento implica las cuatro combinaciones de tratamientos que se listan en la 
siguiente tabla. Se usan ocho unidades experimentales, que son especímenes de alumi- 
nio preparados, dos de los cuales se asignan aleatoriamente a cada una de las cuatro 
combinaciones de tratamiento. Los datos se presentan en la tabla 1.2. 

Los datos de la corrosión son promedios de los dos especímenes. En la figura 1.3 se 
presenta una gráfica con los promedios. Un valor relativamente grande de ciclos hasta la 
ruptura representa una cantidad pequeña de corrosión. Como se podría esperar, al parecer 
un incremento en la humedad hace que empeore la corrosión. El uso del procedimiento 
de recubrimiento químico contra la corrosión parece reducir la corrosión. JJ 

En este ejemplo de diseño experimental el ingeniero eligió sistemáticamente las 
cuatro combinaciones de tratamiento. Para vincular esta situación con los conceptos con 
los que el lector se ha familiarizado hasta aquí, deberíamos suponer que las condiciones 
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Tabla 1.2: Datos para el ejemplo 1.3 


Promedio de corrosión 


Recubrimiento Humedad en miles de ciclos hasta la ruptura 
Sin recubrimiento 20% 975 
80% 350 
Con recubrimiento 20% 1750 
químico contra la corrosión 80% 1550 
2000 


Con recubrimiento químico 
contra la corrosión 


1000 


Corrosión promedio 


Sin recubrimiento 


20% 80% 
Humedad 


Figura 1.3: Resultados de corrosión para el ejemplo 1.3. 


que representan las cuatro combinaciones de tratamientos son cuatro poblaciones sepa- 
radas y que los dos valores de corrosión observados en cada una de las poblaciones 
constituyen importantes piezas de información. La importancia del promedio al captar y 
resumir ciertas características en la población se destacará en la sección 1.3. Aunque a 
partir de la figura podríamos sacar conclusiones acerca del papel que desempeña la hu- 
medad y del efecto de recubrir los especímenes, no podemos evaluar con exactitud los 
resultados de un punto de vista analítico sin tomar en cuenta la variabilidad alrededor 
del promedio. De nuevo, como señalamos con anterioridad, si los dos valores de corro- 
sión en cada una de las combinaciones de tratamientos son muy cercanos, la imagen 
de la figura 1.3 podría ser una descripción precisa. Pero si cada valor de la corrosión en 
la figura es un promedio de dos valores que están ampliamente dispersos, entonces esta 
variabilidad podría, de hecho, en verdad “eliminar” cualquier información que parezca 
difundirse cuando tan sólo se observan los promedios. Los siguientes ejemplos ilustran 
estos conceptos: 


1. La asignación aleatoria a las combinaciones de tratamientos (recubrimiento/ 
humedad) de las unidades experimentales (especímenes). 


2. El uso de promedios muestrales (valores de corrosión promedio) para resumir 
la información muestral. 


3. La necesidad de considerar las medidas de variabilidad en el análisis de cual- 
quier muestra o conjunto de muestras. 
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Este ejemplo sugiere la necesidad de estudiar el tema que se expone en las seccio- 
nes 1.3 y 1.4, es decir, el de las estadísticas descriptivas que indican las medidas de la 
ubicación del centro en un conjunto de datos, y aquellas con las que se mide la variabilidad. 


1.3 Medidas de localización: la media y la mediana de una muestra 


Definición 1.1: 


Definición 1.2: 


Las medidas de localización están diseñadas para brindar al analista algunos valores 
cuantitativos de la ubicación central o de otro tipo de los datos en una muestra. En el ejem- 
plo 1.2 parece que el centro de la muestra con nitrógeno claramente excede al de la 
muestra sin nitrógeno. Una medida obvia y muy útil es la media de la muestra. La me- 
dia es simplemente un promedio numérico. 


Suponga que las observaciones en una muestra son х, X,, ..., х. La media de la mues- 
tra, que se denota con x, es 


n 
Е y 4 A a ЫЛ? 
х = — 5 
п n 
1=1 


Hay otras medidas de tendencia central que se explican con detalle en capítulos 
posteriores. Una medida importante es la mediana de la muestra. El propósito de la 
mediana de la muestra es reflejar la tendencia central de la muestra de manera que no sea 
influida por los valores extremos. 


Dado que las observaciones en una muestra son x,, х,, ..., х, acomodadas en orden de 
magnitud creciente, la mediana de la muestra es 


g = ¿om si n es impar, 
= ; 
z (%һузЕХ„/э+1), si п es par. 


Por ejemplo, suponga que el conjunto de datos es el siguiente: 1.7, 2,2, 3.9, 3.11 y 
14.7. La media y la mediana de la muestra son, respectivamente, 


Хх = 5.12, x=3.9, 


Es evidente que la media es influida de manera considerable рог la presencia de la 
observación extrema, 14.7; en tanto que el lugar de la mediana hace énfasis en el verda- 
dero “centro” del conjunto de datos. En el caso del conjunto de datos de dos muestras del 
ejemplo 1.2, las dos medidas de tendencia central para las muestras individuales son 


х (sin nitrógeno) = 0.399 gramos, 
Х (sin nitrógeno) = 238104 = 0.400 gramos, 
х (con nitrógeno) = 0.565 gramos, 
Х (con nitrógeno) = _ = 0.505 gramos. 


Es evidente que hay una diferencia conceptual entre la media y la mediana. Para el 
lector con ciertas nociones de ingeniería quizá sea de interés que la media de la muestra 
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es el centroide de los datos en una muestra. En cierto sentido es el punto en el cual se 
puede colocar un fulcro (apoyo) para equilibrar un sistema de “pesos”, que son las ubi- 
caciones de los datos individuales. Esto se muestra en la figura 1.4 respecto de la muestra 
“con nitrógeno”. 


Figura 1.4: Media de la muestra como centroide del peso del tallo con nitrógeno. 


En capítulos posteriores la base para el cálculo de x es un estimado de la media de 
la población. Como antes señalamos, el propósito de la inferencia estadística es obtener 
conclusiones acerca de las características o parámetros y la estimación es una caracte- 
rística muy importante de la inferencia estadística. 

La mediana y la media pueden ser muy diferentes entre sí. Observe, sin embargo, 
que en el caso de los datos del peso de los tallos el valor de la media de la muestra para 
“sin nitrógeno” es bastante similar al valor de la mediana. 


Otras medidas de localización 


Hay muchos otros métodos para calcular la ubicación del centro de los datos en la mues- 
tra. No los trataremos en este momento. Por lo general las alternativas para la media de 
la muestra se diseñan con el fin de generar valores que representen relación entre la me- 
dia y la mediana. Rara vez utilizamos alguna de tales medidas. Sin embargo, es aleccio- 
nador estudiar una clase de estimadores conocida como media recortada, la cual se 
calcula “quitando” cierto porcentaje de los valores mayores y menores del conjunto. Por 
ejemplo, la media recortada al 10% se encuentra eliminando tanto el 10% de los valores 
mayores como el 10% de los menores, y calculando el promedio de los valores restantes. 
En el caso de los datos del peso de los tallos, eliminaríamos el valor más alto y el más 
bajo, ya que el tamaño de la muestra es 10 en cada caso. De manera que para el grupo 
sin nitrógeno la media recortada al 10% está dada por 


0.32 + 0.37 + 0.47 + 0.43 + 0.36 + 0.42 + 0.38 + 0.43 


Xrec (0) = 5 = 0.39750, 


y para la media recortada al 10% del grupo con nitrógeno tenemos 


4 47 A 32 ү] 7 .62 A 
PEE - 3 + 0.47 + 0.49 + 0.5 7 5 + 0.79 + 0.62 + 0 б _ 056625. 


Observe que en este caso, como se esperaba, las medias recortadas están cerca tanto 
de la media como de la mediana para las muestras individuales. Desde luego, el enfo- 
que de la media recortada es menos sensible a los valores extremos que la media de la 
muestra, pero no tan insensible como la mediana. Además, el método de la media recor- 
tada utiliza más información que la mediana de la muestra. Advierta que la mediana de 
la muestra es, de hecho, un caso especial de la media recortada, en el cual se eliminan 
todos los datos de la muestra y queda sólo el central o dos observaciones. 


Ejercicios 


Ejercicios 


1.1 Se registran las siguientes mediciones para el 
tiempo de secado (en horas) de cierta marca de 
pintura esmaltada. 

34 25 48 2.9 3.6 
28 33 5.6 3.7 2.8 
44 40 52 3.0 4.8 
Suponga que las mediciones constituyen una muestra 
aleatoria simple. 
a) ¿Cuál es el tamaño de la muestra anterior? 
b) Calcule la media de la muestra para estos datos. 
c) Calcule la mediana de la muestra. 
d) Grafique los datos utilizando una gráfica de puntos. 
e) Calcule la media recortada al 20% para el conjun- 
to de datos anterior. 
f) ¿La media muestral para estos datos es más o me- 
nos descriptiva como centro de localización, que 
la media recortada? 


1.2 Según la revista Chemical Engineering, una pro- 
piedad importante de una fibra es su absorción del 
agua. Se toma una muestra aleatoria de 20 pedazos de 
fibra de algodón y se mide la absorción de cada uno. 
Los valores de absorción son los siguientes: 
18.71 21.41 20.72 21.81 1929 22.43 20.17 
23.71 19.44 20.50 18.92 20.33 23.00 22.85 
19.25 21.77 22.11 19.77 18.04 21.12 
a) Calcule la media y la mediana muestrales para los 
valores de la muestra anterior. 
b) Calcule la media recortada al 10%. 
c) Elabore una gráfica de puntos con los datos de la 
absorción. 
d) Si se utilizan sólo los valores de la media, la me- 
diana y la media recortada, ¿hay evidencia de va- 
lores extremos en los datos? 


1.3 Se utiliza cierto polímero para los sistemas de 
evacuación de los aviones. Es importante que el polí- 
mero sea resistente al proceso de envejecimiento. Se 
utilizaron veinte especímenes del polímero en un expe- 
rimento. Diez se asignaron aleatoriamente para expo- 
nerse a un proceso de envejecimiento acelerado del 
lote, el cual implica la exposición a altas temperaturas 
durante 10 días. Se hicieron las mediciones de resisten- 
cia a la tensión de los especímenes y se registraron los 
siguientes datos sobre resistencia a la tensión en psi. 
227 222 218 217 225 
218 216 229 228 221 
Con envejecimiento: 219 214 215 211 209 
218 203 204 201 205 


a) Elabore la gráfica de puntos de los datos. 
b) ¿En la gráfica que obtuvo parece que el proceso 
de envejecimiento tuvo un efecto en la resistencia 


Sin envejecimiento: 
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a la tensión de este polímero? Explique su res- 
puesta. 

c) Calcule la resistencia a la tensión de la media de la 
muestra en las dos muestras. 

d) Calcule la mediana de ambas. Analice la similitud 
O falta de similitud entre la media y la mediana de 
cada grupo. 


1.4 En un estudio realizado por el Departamento de 
Ingeniería Mecánica del Tecnológico de Virginia 
se compararon las varillas de acero que abastecen dos 
compañías diferentes. Se fabricaron diez resortes de 
muestra con las varillas de metal proporcionadas por 
cada una de las compañías y se registraron sus medidas 
de flexibilidad. Los datos son los siguientes: 


Compañía A: 93 88 68 87 8.5 
67 80 65 92 70 
Compañía B: 11.0 9.8 9.9 10.2 10.1 


9.7 11.0 11.1 10.2 9.6 


a) Calcule la media y la mediana de la muestra para 
los datos de ambas compañías. 

b) Grafique los datos para las dos compañías en la mis- 
ma línea y explique su conclusión respecto de cual- 
quier aparente diferencia entre las dos compañías. 


1.5 Veinte hombres adultos de entre 30 y 40 años de 
edad participaron en un estudio para evaluar el efecto 
de cierto régimen de salud, que incluye dieta y ejerci- 
cio, en el colesterol sanguíneo. Se eligieron aleatoria- 
mente diez para el grupo de control y los otros diez se 
asignaron para participar en el régimen como el grupo 
de tratamiento durante un periodo de seis meses. Los 
siguientes datos muestran la reducción en el colesterol 
que experimentaron en ese periodo los 20 sujetos: 


Grupo de control: T 3 —4 14 2 
5 22 —7 9 5 
Grupo de tratamiento: —6 5 9 4 4 


12 37 5 3 3 


a) Elabore una gráfica de puntos con los datos de am- 
bos grupos en la misma gráfica. 

b) Calcule la media, la mediana y la media recortada 
al 10% para ambos grupos. 

c) Explique por qué la diferencia en las medias sugie- 
re una conclusión acerca del efecto del régimen, en 
tanto que la diferencia en las medianas o las me- 
dias recortadas sugiere una conclusión diferente. 


1.6 La resistencia а la tensión del caucho de silicio se 
considera una función de la temperatura de vulcanizado. 
Se llevó a cabo un estudio en el que se prepararon 
muestras de 12 especímenes del caucho utilizando tempe- 
raturas de vulcanizado de 20°С y 45°С. Los siguientes 
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datos presentan los valores de resistencia a la tensión b) Calcule la resistencia a la tensión media muestral 
en megapascales. para ambas muestras. 
20°С: 207 214 222 203 221 2.03 c) Al observar la gráfica, ¿le parece que la temperatu- 
205 2.18 209 214 211 2.02 ra de vulcanizado influye en la resistencia a la ten- 
45°C: 2.52 2.15 2.49 2.03 2.37 2.05 sión? Explique su respuesta. 
199 242 208 242 229 2.01 d) ¿En qué otra cosa, al parecer, influye el incremen- 


a) Elabore una gráfica de puntos con los datos, tanto 
de los valores de resistencia a la tensión a tempe- 
ratura alta como los de a temperatura baja. 


1.4 Medidas de variabilidad 


to en la temperatura de vulcanizado? Explique su 
respuesta. 


La variabilidad de una muestra desempeña un papel importante en el análisis de datos. La 
variabilidad de procesos y productos es un hecho real en los sistemas científicos y de 
ingeniería: el control o la reducción de la variabilidad de un proceso a menudo es una 
fuente de mayores dificultades. Cada vez más ingenieros y administradores de procesos 
están aprendiendo que la calidad del producto y, como resultado, las utilidades que se 
derivan de los productos manufacturados es, con mucho, una función de la variabili- 
dad del proceso. En consecuencia, gran parte de los capítulos 9 a 15 se dedica al aná- 
lisis de datos y a los procedimientos de modelado en los que la variabilidad de la muestra 
desempeña un papel significativo. Incluso en problemas pequeños de análisis de datos el 
éxito de un método estadístico específico podría depender de la magnitud de la variabi- 
lidad entre las observaciones en la muestra. Las medidas de ubicación en una muestra no 
brindan un resumen adecuado de la naturaleza de un conjunto de datos. Considere el 
ejemplo 1.2, en el que no podemos concluir que el uso del nitrógeno aumenta el creci- 
miento sin tomar en cuenta la variabilidad de la muestra. 

Aunque los detalles del análisis de este tipo de conjuntos de datos se estudiarán en 
el capítulo 9, a partir de la figura 1.1 debería quedar claro que la variabilidad entre las 
observaciones sin nitrógeno y la variabilidad entre las observaciones con nitrógeno tie- 
ne, desde luego, alguna consecuencia. De hecho, parece que la variabilidad dentro de la 
muestra con nitrógeno es mayor que la de la muestra sin nitrógeno. Quizás haya algo 
acerca de la inclusión del nitrógeno que no sólo incrementa el peso de los tallos (х de 
0.565 gramos en comparación con una x de 0.399 gramos para la muestra sin nitrógeno), 
sino que también incrementa la variabilidad en el peso de los tallos (es decir, provoca 
que el peso de los tallos sea más inconsistente). 

Por ejemplo, compare los dos conjuntos de datos de abajo. Cada uno contiene dos 
muestras y la diferencia en las medias es aproximadamente la misma para ambas, aunque el 
conjunto de datos B parece proporcionar un contraste mucho más claro entre las dos pobla- 
ciones de las que se tomaron las muestras. Si el propósito de tal experimento es detectar la 
diferencia entre las dos poblaciones, esto se logra en el caso del conjunto de datos B. Sin 
embargo, en el conjunto de datos A la amplia variabilidad dentro de las dos muestras 
ocasiona dificultad. De hecho, no es claro que haya una diferencia entre las dos poblaciones. 


Conjunto de datos A: XX XX XX 0XX00XXX0 0000000 


Conjunto de datos B: XX XXX XXXXXX 00000000000 
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Rango y desviación estándar de la muestra 


Definición 1.3: 


Así como hay muchas medidas de tendencia central o de localización, hay muchas 
medidas de dispersión o variabilidad. Quizá la más simple sea el rango de la muestra 
X  —X_ .Elrango puede ser muy útil y se examina con amplitud en el capítulo 17 
máx mín Бай . á 2 ‚т q. 2 
sobre control estadístico de calidad. La medida muestral de dispersión que se utiliza más 
a menudo es la desviación estándar de la muestra. Nuevamente denotemos con х}, 


Х.Х, los valores de la muestra. 


La varianza de la muestra, denotada con s?, está dada por 


n Ol 
A (0) 
5 = > FEO * 


i=l 


La desviación estándar de la muestra, denotada con s, es la raíz cuadrada positiva de 
s?, es decir, 


Е 


Para el lector debería quedar claro que la desviación estándar de la muestra es, de 
hecho, una medida de variabilidad. Una variabilidad grande en un conjunto de datos 
produce valores relativamente grandes de (x — x)? y, por consiguiente, una varianza 
muestral grande. La cantidad n — 1 a menudo se denomina grados de libertad asocia- 
dos con la varianza estimada. En este ejemplo sencillo los grados de libertad representan 
el número de piezas de información independientes disponibles para calcular la variabi- 
lidad. Por ejemplo, suponga que deseamos calcular la varianza de la muestra y la desvia- 
ción estándar del conjunto de datos (5, 17, 6, 4). El promedio de la muestra es x = 8. El 
cálculo de la varianza implica: 


(5 — 8P + (17 — 8 + (6 — 8)? + (4 — 8)? = (-3) + 9 + (-2Y + (-4Y. 


n 
Las cantidades dentro de los paréntesis suman сего. En general, > (x; — х) = 0 
i=l 
(véase el ejercicio 1.16 de la página 31). Entonces, el cálculo de la varianza de una mues- 
tra no implica n desviaciones cuadradas independientes de la media х. De hecho, 
como el último valor de x — xes determinado por los primeros n — 1 valores, decimos 
que éstas son n — 1 “piezas de información” que produce s?. Por consiguiente, hay n — 1 
grados de libertad en vez de n grados de libertad para calcular la varianza de una muestra. 


Ejemplo 1.4: | En un ejemplo que se estudia ampliamente en el capítulo 10, un ingeniero se interesa en 


probar el “sesgo” en un medidor de pH. Los datos se recaban con el medidor mediante 
la medición del pH de una sustancia neutra (pH = 7.0). Se toma una muestra de tamaño 
10 y se obtienen los siguientes resultados: 


7.07 7.00 7.10 6.97 7.00 7.03 7.01 7.01 6.98 7.08. 


La media de la muestra y está dada por 


ста 7.07 + 7.00 + то Her 7.08 _ 7.0250. 
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La varianza de la muestra s? está dada por 


52 = 510.07 — 7.025)? + (7.00 — 7.025)? + (7.10 — 7.025)? 


+++ + (7.08 — 7.025) ] = 0.001939. 


Como resultado, la desviación estándar de la muestra está dada por 


s = V0.001939 = 0.044. 


Así que la desviación estándar de la muestra es 0.0440 con n — 1 = 9 grados de 
libertad. J 


Unidades para la desviación estándar y la varianza 


A partir de la definición 1.3 debería ser evidente que la varianza es una medida de la 
desviación cuadrática promedio de la media x. Empleamos el término desviación cua- 
drática promedio aun cuando la definición utilice una división entre n — 1 grados de 
libertad en vez de n. Desde luego, si n es grande, la diferencia en el denominador es in- 
consecuente. Por lo tanto, la varianza de la muestra tiene unidades que son el cuadrado 
de las unidades en los datos observados; aunque la desviación estándar de la muestra se 
encuentra en unidades lineales. Considere los datos del ejemplo 1.2. Los pesos del tallo 
se miden en gramos. Como resultado, las desviaciones estándar de la muestra están en 
gramos y las varianzas se miden en gramos?. De hecho, las desviaciones estándar indivi- 
duales son 0.0728 gramos para el caso sin nitrógeno y 0.1867 gramos para el grupo con 
nitrógeno. Observe que la desviación estándar en verdad indica una variabilidad mucho 
más grande en la muestra con nitrógeno. Esta condición se destaca en la figura 1.1. 


¿Cuál es la medida de variabilidad más importante? 


Como indicamos antes, el rango de la muestra tiene aplicaciones en el área del control 
estadístico de la calidad. Quizás el lector considere que es redundante utilizar la varianza 
de la muestra y la desviación estándar de la muestra. Ambas medidas reflejan el mismo 
concepto en la variabilidad de la medición, pero la desviación estándar de la muestra 
mide la variabilidad en unidades lineales; en tanto que la varianza muestral se mide en 
unidades cuadradas. Ambas desempeñan papeles importantes en el uso de los métodos 
estadísticos. Mucho de lo que se logra en el contexto de la inferencia estadística implica 
la obtención de conclusiones acerca de las características de poblaciones. Entre tales 
características son constantes los denominados parámetros de la población. Dos pará- 
metros importantes son la media de la población y la varianza de la población. La 
varianza de la muestra desempeña un papel explícito en los métodos estadísticos que se 
utilizan para obtener inferencias sobre la varianza de la población. La desviación están- 
dar de la muestra desempeña un papel importante, junto con la media de la muestra, en 
las inferencias que se realizan acerca de la media de la población. En general, la varian- 
za se considera más en la teoría inferencial, mientras que la desviación estándar se utiliza 
más en aplicaciones. 


1.5 Datos discretos y continuos 


Ejercicios 


1.7 Considere los datos del tiempo de secado del 
ejercicio 1.1 de la página 13. Calcule la varianza de la 
muestra y la desviación estándar de la muestra. 


1.8 Calcule la varianza de la muestra y la desviación 
estándar para los datos de absorción del agua del ejer- 
cicio 1.2 de la página 13. 


1.9 El ejercicio 1.3 de la página 13 presentó datos de 
resistencia a la tensión de dos muestras, una en la que 
los especímenes se expusieron a un proceso de enveje- 
cimiento y otra en la que no se efectuó tal proceso en 
los especímenes. 

a) Calcule la varianza de la muestra, así como su des- 
viación estándar, en cuanto a la resistencia a la 
tensión en ambas muestras. 

b) ¿Parece haber alguna evidencia de que el envejeci- 
miento afecta la variabilidad en la resistencia a la 
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tensión? (Véase también la gráfica para el ejercicio 
1.3 de la página 13). 


1.10 Рага los datos del ejercicio 1.4 de la página 13 cal- 
cule tanto la media como la varianza de la “flexibilidad” 
para las compañías A y B. ¿Parece que hay una diferencia 
de flexibilidad entre la compañía A y la compañía B? 


1.11 Considere los datos del ejercicio 1.5 de la pági- 
na 13. Calcule la varianza de la muestra y la desviación 
estándar de la muestra para ambos grupos: el de trata- 
miento y el de control. 


1.12 Para el ejercicio 1.6 de la página 13 calcule la 
desviación estándar muestral de la resistencia a la ten- 
sión para las muestras, de forma separada para ambas 
temperaturas. ¿Parece que un incremento en la tempe- 
ratura influye en la variabilidad de la resistencia a la 
tensión? Explique su respuesta. 


La inferencia estadística a través del análisis de estudios observacionales o de diseños 
experimentales se utiliza en muchas áreas científicas. Los datos reunidos pueden ser 
discretos o continuos, según el área de aplicación. Por ejemplo, un ingeniero químico 
podría estar interesado en un experimento que lo lleve a condiciones en que se maximice 
la producción. Aquí, por supuesto, la producción se expresaría en porcentaje, o gramos/ 
libra, medida en un continuo. Por otro lado, un toxicólogo que realice un experimento de 
combinación de fármacos quizás encuentre datos que son binarios por naturaleza (es 
decir, el paciente responde o no lo hace). 

En la teoría de la probabilidad se hacen distinciones importantes entre datos discretos 
y continuos que nos permiten hacer inferencias estadísticas. Con frecuencia las aplica- 
ciones de la inferencia estadística se encuentran cuando se trabaja con datos por conteo. 
Por ejemplo, un ingeniero podría estar interesado en estudiar el número de partículas 
radiactivas que pasan a través de un contador en, digamos, 1 milisegundo. Al personal 
responsable de la eficiencia de una instalación portuaria podría interesarle conocer las 
características del número de buques petroleros que llegan diariamente a cierta ciudad 
portuaria. En el capítulo 5 se examinarán varios escenarios diferentes que conducen a 
distintas formas de manejo de los datos para situaciones con datos por conteo. 

Incluso en esta fase inicial del texto se debería poner especial atención a algunos 
detalles que se asocian con datos binarios. Son muchas las aplicaciones que requieren 
el análisis estadístico de datos binarios. Con frecuencia la medición que se utiliza en el 
análisis es la proporción muestral. En efecto, la situación binaria implica dos categorías. 
Si en los datos hay n unidades y x se define como el número que cae en la categoría 1, en- 
tonces n — x cae en la categoría 2. Así, x/n es la proporción muestral en la categoría 1 y 
1 — х/п es la proporción muestral en la categoría 2. En la aplicación biomédica, por 
ejemplo, 50 pacientes representarían las unidades de la muestra y si, después de que se 
les suministra el medicamento, 20 de los 50 experimentaran mejoría en sus malestares 
estomacales (que son comunes en los 50), entonces =: = 0.4 sería la proporción muestral 
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para la cual el medicamento tuvo éxito, y 1 — 0.4 = 0.6 sería la proporción muestral para 
la cual el fármaco no tuvo éxito. En realidad, la medición numérica fundamental 
para datos binarios por lo general se denota con 0 o con 1. Éste es el caso de nuestro 
ejemplo médico, en el que un resultado exitoso se denota con un 1 y uno no exitoso con 
un 0. Entonces, la proporción muestral es en realidad una media muestral de unos y ce- 
ros. Para la categoría de éxitos, 


XxX1+Xx2+:::+Xs50 _ 1+1+0+---+0+1 _ 20 _ 


— == = 0.4. 
50 50 50 j 


¿Qué clases de problemas se resuelven en situaciones con datos binarios? 


Los tipos de problemas que enfrentan científicos e ingenieros que usan datos binarios no 
son muy difíciles, a diferencia de aquellos en los que las mediciones de interés son las 
continuas. Sin embargo, se utilizan técnicas diferentes debido a que las propiedades es- 
tadísticas de las proporciones muestrales son bastante diferentes de las medias muestra- 
les que resultan de los promedios tomados de poblaciones continuas. Considere los datos 
del ejemplo en el ejercicio 1.6 de la página 13. El problema estadístico subyacente en 
este caso se enfoca en si una intervención, digamos un incremento en la temperatura de 
vulcanizado, alterará la resistencia a la tensión de la media de la población que se asocia 
con el proceso del caucho de silicio. Por otro lado, en el área de control de calidad, su- 
ponga que un fabricante de neumáticos para automóvil informa que en un embarque con 
5000 neumáticos, seleccionados aleatoriamente del proceso, hay 100 defectuosos. Aquí 
la proporción muestral es e = 0.02. Luego de realizar un cambio en el proceso dise- 
ñado para reducir los neumáticos defectuosos, se toma una segunda muestra de 5000 y 
se encuentran 90 defectuosos. La proporción muestral se redujo a ЕЕ = 0.018. En- 
tonces, surge una pregunta: “¿La disminución en la proporción muestral de 0.02 a 0.018 
es suficiente para sugerir una mejoría real en la proporción de la población?” En ambos 
casos se requiere el uso de las propiedades estadísticas de los promedios de la muestra: 
uno de las muestras de poblaciones continuas y el otro de las muestras de poblaciones 
discretas (binarias). En ambos casos la media de la muestra es un estimado de un pará- 
metro de la población, una media de la población en el primer caso (es decir, la media 
de la resistencia a la tensión) y una proporción de la población (o sea, la proporción de 
neumáticos defectuosos en la población) en el segundo caso. Así que aquí tenemos esti- 
mados de la muestra que se utilizan para obtener conclusiones científicas respecto de los 
parámetros de la población. Como indicamos en la sección 1.3, éste es el tema general 
en muchos problemas prácticos en los que se usa la inferencia estadística. 


1.6 Modelado estadístico, inspección científica y diagnósticos gráficos 


A menudo, el resultado final de un análisis estadístico es la estimación de los parámetros 
de un modelo postulado. Éste es un proceso natural para los científicos y los ingenie- 
ros, ya que con frecuencia usan modelos. Un modelo estadístico no es determinista, es 
más bien un modelo que conlleva algunos aspectos probabilísticos. A menudo una forma 
de modelo es la base de las suposiciones que hace el analista. En el ejemplo 1.2 el cien- 
tífico podría desear determinar, a través de la información de la muestra, algún nivel de 
distinción entre las poblaciones tratadas con nitrógeno y las poblaciones no tratadas. El 
análisis podría requerir cierto modelo para los datos; por ejemplo, que las dos muestras 
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provengan de distribuciones normales o gaussianas. Véase el capítulo 6 para el estudio 
de la distribución normal. 

Es evidente que quienes utilizan métodos estadísticos no pueden generar la infor- 
mación o los datos experimentales suficientes para describir a la totalidad de la pobla- 
ción. Pero es frecuente que se utilicen los conjuntos de datos para aprender sobre ciertas 
propiedades de la población. Los científicos y los ingenieros están acostumbrados a 
manejar conjuntos de datos. Debería ser obvia la importancia de describir o resumir la 
naturaleza de los conjuntos de datos. Con frecuencia el resumen gráfico de un conjunto 
de datos puede proporcionar información sobre el sistema del que se obtuvieron los da- 
tos. Por ejemplo, en las secciones 1.1 y 1.3 mostramos gráficas de puntos. 

En esta sección se estudia con detalle el papel del muestreo y de la graficación de 
los datos para mejorar la inferencia estadística. Nos limitamos a presentar algunas grá- 
ficas sencillas, pero a menudo efectivas, que complementan el estudio de poblaciones 
estadísticas. 


Diagrama de dispersión 


A veces el modelo postulado puede tener una forma algo más compleja. Por ejemplo, 
considere a un fabricante de textiles que diseña un experimento en donde se producen 
especímenes de tela que contienen diferentes porcentajes de algodón. Considere los da- 
tos de la tabla 1.3. 


Tabla 1.3: Resistencia a la tensión 


Porcentaje del algodón Resistencia a la tensión 


15 7,7, 9, 8, 10 
20 19, 20, 21, 20, 22 
25 21, 21, 17, 19, 20 
30 8, 7, 8, 9, 10 


Se fabrican cinco especímenes de tela para cada uno de los cuatro porcentajes de 
algodón. En este caso tanto el modelo para el experimento como el tipo de análisis que 
se utiliza deberían tomar en cuenta el objetivo del experimento y los insumos importan- 
tes del científico textil. Algunas gráficas sencillas podrían mostrar la clara distinción 
entre las muestras. Véase la figura 1.5; las medias y la variabilidad muestrales se describen 
bien en el diagrama de dispersión. El objetivo de este experimento podría ser simple- 
mente determinar cuáles porcentajes de algodón son verdaderamente distintos de los 
otros. En otras palabras, como en el caso de los datos con nitrógeno y sin nitrógeno, 
¿para cuáles porcentajes de algodón existen diferencias claras entre las poblaciones o, de 
forma más específica, entre las medias de las poblaciones? En este caso quizás un mode- 
lo razonable es que cada muestra proviene de una distribución normal. Aquí el objetivo 
es muy semejante al de los datos con nitrógeno y sin nitrógeno, excepto que se incluyen 
más muestras. El formalismo del análisis implica nociones de prueba de hipótesis, los 
cuales se examinarán en el capítulo 10. A propósito, quizás este formalismo no sea 
necesario a la luz del diagrama de diagnóstico. Pero, ¿describe éste el objetivo real del 
experimento y, por consiguiente, el enfoque adecuado para el análisis de datos? Es pro- 
bable que el científico anticipe la existencia de una resistencia a la tensión máxima de la 
media de la población en el rango de concentración de algodón en el experimento. Aquí 
el análisis de los datos debería girar en torno a un tipo diferente de modelo, es decir, uno 
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que postule un tipo de estructura que relacione la resistencia a la tensión de la media de la 
población con la concentración de algodón. En otras palabras, un modelo se puede escri- 
bir como 


н = б, + ВС + B,C’, 


en donde џи, е$ la resistencia a la tensión de la media de la población, que varía con la 
cantidad de algodón en el producto C. La implicación de este modelo es que, para un 
nivel fijo de algodón, hay una población de mediciones de resistencia a la tensión y la 
media de la población es џи, . Este tipo de modelo, que se denomina modelo de regre- 
sión, se estudiará en los capítulos 11 y 12. La forma funcional la elige el científico. A 
veces el análisis de datos puede sugerir que se cambie el modelo. Entonces el analista de 
datos “considera” un modelo que se pueda alterar después de hacer cierto análisis. El uso 
de un modelo empírico va acompañado рог la teoría de estimación, donde B,, В, y В, 
se estiman a partir de los datos. Además, la inferencia estadística se puede, entonces, 
utilizar para determinar lo adecuado del modelo. 
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Figura 1.5: Diagrama de dispersión de la resistencia a la tensión 
y los porcentajes de algodón. 


Aquí se hacen evidentes dos puntos de las dos ilustraciones de datos: 1) el tipo de 
modelo que se emplea para describir los datos a menudo depende del objetivo del expe- 
rimento, y 2) la estructura del modelo debería aprovechar el insumo científico no estadís- 
tico. La selección de un modelo representa una suposición fundamental sobre la que 
se basa la inferencia estadística resultante. A lo largo del libro se hará evidente la im- 
portancia que las gráficas pueden llegar a tener. A menudo las gráficas ilustran informa- 
ción que permite que los resultados de la inferencia estadística formal se comuniquen 
mejor al científico o al ingeniero. A veces las gráficas o el análisis exploratorio de los 
datos pueden enseñar al analista información que no se obtiene del análisis formal. 
Casi cualquier análisis formal requiere suposiciones que se desarrollan a partir del mo- 
delo de datos. Las gráficas pueden resaltar la violación de suposiciones que de otra 
forma no se notarían. A lo largo del libro las gráficas se utilizarán de manera extensa 
para complementar el análisis formal de los datos. En las siguientes secciones se pre- 
sentan algunas herramientas gráficas que son útiles para el análisis exploratorio o des- 
criptivo de los datos. 
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Diagrama de tallo y hojas 


Los datos estadísticos obtenidos de poblaciones grandes pueden ser muy útiles para es- 
tudiar el comportamiento de la distribución si se presentan en una combinación tabular 
y gráfica conocida como diagrama de tallo y hojas. 

Para ejemplificar la elaboración de un diagrama de tallo y hojas considere los datos 
de la tabla 1.4, que especifican la “vida” de 40 baterías para automóvil similares, regis- 
tradas al décimo de año más cercano. Las baterías se garantizan por tres años. Comience 
por dividir cada observación en dos partes: una para el tallo y otra para las hojas, de 
manera que el tallo represente el dígito entero que antecede al decimal y la hoja corres- 
ponda a la parte decimal del número. En otras palabras, para el número 3.7 el dígito 3 se 
designa al tallo y el 7 a la hoja. Para nuestros datos los cuatro tallos 1, 2, 3 y 4 se listan 
verticalmente del lado izquierdo de la tabla 1.5, en tanto que las hojas se registran en el 
lado derecho correspondiente al valor del tallo adecuado. Entonces, la hoja 6 del número 
1.6 se registra enfrente del tallo 1; la hoja 5 del número 2.5 enfrente del tallo 2; y así 
sucesivamente. El número de hojas registrado junto a cada tallo se anota debajo de la 
columna de frecuencia. 


Tabla 1.4: Vida de las baterías para automóvil 


22 41 35 45 32 37 3.0 2.6 
34 16 31 33 38 31 47 3.7 
25 43 34 36 29 33 3.9 31 
33 31 37 44 32 41 19 34 
47 38 32 26 3.9 3.0 42 35 


Tabla 1.5: Diagrama de tallo y hojas de la vida de las baterías 


Tallo Hoja Frecuencia 
1 69 2 
2 25669 5 
3 0011112223334445567778899 25 
4 11234577 8 


El diagrama de tallo y hojas de la tabla 1.5 contiene sólo cuatro tallos y, en conse- 
cuencia, no ofrece una representación adecuada de la distribución. Para solucionar este 
problema es necesario aumentar el número de tallos en nuestro diagrama. Una manera 
sencilla de hacerlo consiste en escribir dos veces cada valor del tallo y después registrar 
las hojas 0, 1, 2, 3 y 4 enfrente del valor del tallo adecuado, donde aparezca por primera 
vez; y las hojas 5, 6, 7, 8 y 9 enfrente de este mismo valor del tallo, donde aparece la 
segunda vez. El diagrama doble de tallo y hojas modificado se ilustra en la tabla 1.6, 
donde los tallos que corresponden a las hojas 0 a 4 fueron codificados con el símbolo ж 
y los tallos correspondientes a las hojas 5 a 9 con el símbolo •. 

En cualquier problema dado debemos decidir cuáles son los valores del tallo ade- 
cuados. Esta decisión se toma hasta cierto punto de manera arbitraria, aunque debemos 
guiarnos por el tamaño de nuestra muestra. Por lo general elegimos entre 5 y 20 tallos. 
Cuanto más pequeña sea la cantidad de datos disponibles, más pequeña será nuestra 
elección del número de tallos. Por ejemplo, si los datos constan de números del 1 al 21, 
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los cuales representan el número de personas en la fila de una cafetería en 40 días labo- 
rables seleccionados al azar, y elegimos un diagrama doble de tallo y hojas, los tallos 
serían ОЖ, 0°, 1%, 1. y 2X, de manera que la observación de 1 más pequeña tiene tallo 
Ож y hoja 1, el número 18 tiene tallo 1• y hoja 8, y la observación de 21 más grande tiene 
tallo 2x y hoja 1. Por otro lado, si los datos constan de números de $18,800 a $19,600, 
que representan las mejores ventas posibles de 100 automóviles nuevos, obtenidos de 
cierto concesionario, y elegimos un diagrama sencillo de tallo y hojas, los tallos serían 
188, 189, 190, ..., 196 y las hojas contendrían ahora dos dígitos cada una. Un automóvil 
que se vende en $19,385 tendría un valor de tallo de 193 y 85 en los dos dígitos de la 
hoja. En el diagrama de tallo y hojas, las hojas de dígitos múltiples que pertenecen al 
mismo tallo por lo regular están separadas por comas. En los datos generalmente se 
ignoran los puntos decimales cuando todos los números a la derecha del punto decimal 
representan hojas, como en el caso de las tablas 1.5 y 1.6. Sin embargo, si los datos 
constaran de números que van de 21.8 a 74.9, podríamos elegir los dígitos 2, 3, 4, 5, 6 y 
7 como los tallos, de manera que un número como 48.3 tendría un valor de tallo de 4 
y un valor de hoja de 8.3. 


Tabla 1.6: Diagrama doble de tallo y hojas para la vida de las baterías 


Tallo Hoja Frecuencia 
1. 69 2 
2% 2 1 
2. 5669 4 
3x 001111222333444 15 
3- 5567778899 10 
4x 11234 5 
4. 577 3 


El diagrama de tallo y hojas representa una manera eficaz de resumir los datos. Otra 
forma consiste en el uso de la distribución de frecuencias, donde los datos, agrupados 
en diferentes clases o intervalos, se pueden construir contando las hojas que pertenecen 
a cada tallo y considerando que cada tallo define un intervalo de clase. En la tabla 1.5 el 
tallo 1 con 2 hojas define el intervalo 1.0-1.9, que contiene 2 observaciones; el tallo 2 
con 5 hojas define el intervalo 2.0-2.9, que contiene 5 observaciones; el tallo 3 con 25 
hojas define el intervalo 3.0-3.9, con 25 observaciones; y el tallo 4 con 8 hojas define el 
intervalo 4.0-4.9, que contiene 8 observaciones. Para el diagrama doble de tallo y hojas 
de la tabla 1.6 los tallos definen los siete intervalos de clase 1.5-1.9, 2.0-2.4, 2.5-2.9, 
3.0-3.4, 3.5-3.9, 4.0-4.4 y 4.5-4.9, con frecuencias 2, 1, 4, 15, 10, 5 y 3, respectivamente. 


Al dividir cada frecuencia de clase entre el número total de observaciones, obtenemos la 
proporción del conjunto de observaciones en cada una de las clases. Una tabla que lista 
las frecuencias relativas se denomina distribución de frecuencias relativas. En la ta- 
bla 1.7 se presenta la distribución de frecuencias relativas para los datos de la tabla 1.4, 
que muestra los puntos medios de cada intervalo de clase. 

La información que brinda una distribución de frecuencias relativas en forma tabu- 
lar es más fácil de entender si se presenta en forma gráfica. Con los puntos medios de 
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Tabla 1.7: Distribución de frecuencias relativas de la vida de las baterías 


Intervalo Punto medio Frecuencia, Frecuencia 


de clase de la clase f relativa 
1.5-1.9 1.7 2 0.050 
2.0-2.4 2.2 1 0.025 
2.5-2.9 27 4 0.100 
3.0-3.4 3.2 15 0.375 
3.5-3.9 3.7 10 0.250 
4.04.4 4.2 5 0.125 
4.5—4.9 4.7 3 0.075 
0.375 - 
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Vida de la batería (años) 


Figura 1.6: Histograma de frecuencias relativas. 


cada intervalo y las frecuencias relativas correspondientes construimos un histograma 
de frecuencias relativas (figura 1.6). 

Muchas distribuciones de frecuencias continuas se pueden representar gráficamente 
mediante la curva en forma de campana característica de la figura 1.7. Herramientas 
gráficas como las de las figuras 1.6 y 1.7 ayudan a comprender la naturaleza de la pobla- 
ción. En los capítulos 3 y 6 examinaremos una propiedad de la población que se conoce 
como distribución. Aunque más adelante en este texto se proporcionará una definición 
más precisa de una distribución o de una distribución de probabilidad, aquí podemos 
visualizarla como la que se podría haber visto en el límite de la figura 1.7 cuando el ta- 
maño de la muestra aumentara. 

Se dice que una distribución es simétrica si se puede doblar a lo largo de un eje 
vertical de manera que ambos lados coincidan. Si una distribución carece de simetría 
respecto de un eje vertical, se dice que está sesgada. La distribución que se ilustra en la 
figura 1.8a se dice que está sesgada a la derecha porque tiene una cola derecha larga y 
una cola izquierda mucho más corta. En la figura 1.8b observamos que la distribución es 
simétrica; mientras que en la figura 1.8c está sesgada a la izquierda. 

Al girar un diagrama de tallo y hojas en dirección contraria a la de las manecillas del 
reloj en un ángulo de 90%, vemos que las columnas de hojas que resultan forman una 
imagen parecida a un histograma. Por lo tanto, si nuestro objetivo principal al observar 
los datos es determinar la forma general o la forma de la distribución, rara vez será ne- 
cesario construir un histograma de frecuencias relativas. 
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0 1 2 3 4 5 6 
Vida de la batería (años) 


Figura 1.7: Estimación de la distribución de frecuencias. 


(a) (b) (c) 
Figura 1.8: Sesgo de los datos. 


Gráfica de caja y bigote o gráfica de caja 


Otra presentación que es útil para reflejar propiedades de una muestra es la gráfica de 
caja y bigote, la cual encierra el rango intercuartil de los datos en una caja que contiene 
la mediana representada. El rango intercuartil tiene como extremos el percentil 75 (cuar- 
til superior) y el percentil 25 (cuartil inferior). Además de la caja se prolongan “bigotes”, 
que indican las observaciones alejadas en la muestra. Para muestras razonablemente 
grandes la presentación indica el centro de localización, la variabilidad y el grado de 
asimetría. 

Además, una variación denominada gráfica de caja puede ofrecer al observador 
información respecto de cuáles observaciones son valores extremos. Los valores extre- 
mos son observaciones que se consideran inusualmente alejadas de la masa de datos. 
Existen muchas pruebas estadísticas diseñadas para detectar este tipo de valores. Técni- 
camente se puede considerar que un valor extremo es una observación que representa un 
“evento raro” (existe una probabilidad pequeña de obtener un valor que esté lejos de la 
masa de datos). El concepto de valores extremos volverá a surgir en el capítulo 12 en el 
contexto del análisis de regresión. 
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La información visual en las gráficas de caja y bigote o en las de caja no intenta ser 
una prueba formal de valores extremos, más bien se considera una herramienta de diag- 
nóstico. Aunque la determinación de cuáles observaciones son valores extremos varía de 
acuerdo con el tipo de software que se emplee, un procedimiento común para determi- 
narlo consiste en utilizar un múltiplo del rango intercuartil. Por ejemplo, si la distancia 
desde la caja excede 1.5 veces el rango intercuartil (en cualquier dirección), la observa- 
ción se podría considerar un valor extremo. 


Ejemplo 1.5: | Se midió el contenido de nicotina en una muestra aleatoria de 40 cigarrillos. Los datos 
se presentan en la tabla 1.8. 


Tabla 1.8: Valores de nicotina para el ejemplo 1.5 


109 192 2.31 179 2.28 1.74 1.47 1.97 
0.85 124 1.58 2.03 1.70 2.17 2.55 2.11 
186 1.90 1.68 1.51 1.64 0.72 1.69 1.85 
1.82 1.79 2.46 1.88 2.08 1.67 1.37 1.93 
1.40 1.64 2.09 1.75 1.63 2.37 1.75 1.69 


| Т T T 
1.0 1:5 2.0 2.5 


Nicotina 


Figura 1.9: Gráfica de caja y bigote para el ejemplo 1.5. 


La figura 1.9 muestra la gráfica de caja y bigote de los datos, la cual describe las 
observaciones 0.72 y 0.85 como valores extremos moderados en la cola inferior; en 
tanto que la observación 2.55 es un valor extremo moderado en la cola superior. En este 
ejemplo el rango intercuartil es 0.365, y 1.5 veces el rango intercuartil es 0.5475, Por 
otro lado, la figura 1.10 presenta un diagrama de tallo y hojas. JJ 


Ejemplo 1.6: | Considere los datos de la tabla 1.9, que constan de 30 muestras que miden el grosor de 
las “asas” de latas de pintura (véase el trabajo de Hogg y Ledolter de 1992 en la biblio- 
grafía). La figura 1.11 describe una gráfica de caja y bigote para este conjunto asimétrico 
de datos. Observe que el bloque izquierdo es considerablemente más grande que el 
bloque de la derecha. La mediana es 35. El cuartil inferior es 31, mientras que el supe- 
rior es 36. Advierta también que la observación alejada de la derecha está más lejos de 
la caja que la observación extrema de la izquierda. No hay valores extremos en este 
conjunto de datos. 
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El punto decimal se encuentra 1 dígito(s) a la izquierda de I 


7 2 
8 5 
9 
10 9 
11 
12 4 
13 7 
14 07 
15 18 
16 | 3447899 
17 | 045599 
18 | 2568 
19 | 0237 
20 | 389 
21 17 
22 8 
23 17 
24 6 
25 5 


Figura 1.10: Diagrama de tallo y hojas para los datos de nicotina. 


Tabla 1.9: Datos para el ejemplo 1.6 


Muestra Mediciones Muestra Mediciones 
1 29 36 39 34 34 16 35 30 35 29 37 
2 29 29 28 32 31 17 40 31 38 35 31 
3 34 34 39 38 37 18 35 36 30 33 32 
4 35 37 33 38 41 19 35 34 35 30 36 
5 30 29 31 38 29 20 35 35 31 38 36 
6 34 31 37 39 36 21 32 36 36 32 36 
7 30 35 33 40 36 22 36 37 32 34 34 
8 28 28 31 34 30 23 29 34 33 37 35 
9 32 36 38 38 35 24 36 36 35 37 37 
10 35 30 37 35 31 25 36 30 35 33 31 
11 35 30 35 38 35 26 35 30 29 38 35 
12 38 34 35 35 31 27 35 36 30 34 36 
13 34 35 33 30 34 28 35 30 36 29 35 
14 40 35 34 33 35 29 38 36 35 31 31 
15 34 35 38 35 30 30 30 34 40 28 30 


Existen otras formas en las que las gráficas de caja y bigote, y otras presentaciones 
gráficas, pueden ayudar al analista. Las muestras múltiples se pueden comparar de for- 
ma gráfica. Los diagramas de los datos pueden sugerir relaciones entre las variables y las 
gráficas ayudan a detectar anomalías u observaciones extremas en las muestras. 

Existen otros tipos diferentes de diagramas y herramientas gráficas, los cuales 
se estudiarán en el capítulo 8 después de presentar otros detalles teóricos. 
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HA A? Ar. >. AA. AA. A. 
28 30 32 34 36 38 40 


Pintura 


Figura 1.11: Gráfica de caja y bigote del grosor de las “asas” de latas de pintura. 


Otras características distintivas de una muestra 


Hay características de la distribución o de la muestra, además de las medidas del centro de 
localización y variabilidad, que definen aún más su naturaleza. Por ejemplo, en tanto que 
la mediana divide los datos (o su distribución) en dos partes, existen otras medidas 
que dividen partes o segmentos de la distribución que pueden ser muy útiles. Una sepa- 
ración en cuatro partes se hace mediante cuartiles, donde el tercer cuartil separa el cuarto 
(25%) superior del resto de los datos, el segundo cuartil es la mediana y el primer cuartil 
separa el cuarto (25%) inferior del resto de los datos. La distribución puede dividirse 
incluso más detalladamente calculando los percentiles. Tales cantidades dan al analista 
una noción de las denominadas colas de la distribución (es decir, los valores que son 
relativamente extremos, ya sean pequeños o grandes). Por ejemplo, el percentil 95 separa 
el 5% superior del 95% inferior. Para los extremos en la parte inferior o cola inferior de 
la distribución prevalecen definiciones similares. El primer percentil separa el 1% infe- 
rior del resto de la distribución. El concepto de percentiles desempeñará un papel signi- 
ficativo en buena parte de lo que estudiaremos en los siguientes capítulos. 


1.7 Tipos generales de estudios estadísticos: diseño experimental, 
estudio observacional y estudio retrospectivo 


En las siguientes secciones destacaremos el concepto de muestreo de una población y el 
uso de los métodos estadísticos para aprender o quizá para reafirmar la información re- 
levante acerca de una población. La información que se busca y que se obtiene mediante 
el uso de tales métodos estadísticos a menudo influye en la toma de decisiones, así como 
en la resolución de problemas en diversas áreas importantes de ingeniería y científicas. 
Como ilustración, el ejemplo 1.3 describe un experimento sencillo, en el cual los resul- 
tados brindan ayuda para determinar los tipos de condiciones en los que no se recomienda 
utilizar una aleación de aluminio específica que podría ser muy vulnerable a la corro- 
sión. Los resultados serían útiles no sólo para quienes fabrican la aleación, sino también 
para los clientes que consideren adquirirla. Este caso, y muchos otros que se incluyen en 
los capítulos 13 a 15, resaltan el concepto de condiciones experimentales diseñadas о 
controladas (combinaciones de condiciones de recubrimiento y humedad), que son de 
interés para aprender sobre algunas características o mediciones (nivel de corrosión) que 
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surgen de tales condiciones. En las mediciones de la corrosión se emplean métodos es- 
tadísticos que utilizan tanto medidas de tendencia central como de variabilidad. Como 
usted verá más adelante en este texto, tales métodos con frecuencia nos guían hacia un 
modelo estadístico como el que se examinó en la sección 1.6. En este caso el modelo se 
puede usar para estimar (o predecir) las medidas de la corrosión como una función de la 
humedad y el tipo de recubrimiento utilizado. De nuevo, para desarrollar este tipo de 
modelos es muy útil emplear las estadísticas descriptivas que destacan las medidas de ten- 
dencia central y de variabilidad. 

La información que se ofrece en el ejemplo 1.3 ilustra de manera adecuada los tipos 
de preguntas de ingeniería que se plantean y se responden aplicando los métodos esta- 
dísticos que se utilizan en un diseño experimental y se presentan en este texto. Tales 
preguntas son las siguientes: 


1. ¿Cuál es la naturaleza del efecto de la humedad relativa sobre la corrosión de la 
aleación de aluminio dentro del rango de humedad relativa en este experimento? 


li. ¿El recubrimiento químico contra la corrosión reduce los niveles de corrosión 
y existe alguna manera de cuantificar el efecto? 


iii. ¿Hay alguna interacción entre el tipo de recubrimiento y la humedad relativa 
que influya en la corrosión de la aleación? Si es así, ¿cómo se podría interpretar? 


¿Qué es interacción? 


La importancia de las preguntas 1. y її. debería quedar clara para el lector, ya que ambas 
tienen que ver con aspectos importantes tanto para los productores como para los usua- 
rios de la aleación. ¿Pero qué sucede con la pregunta iii.? El concepto de interacción se 
estudiará con detalle en los capítulos 14 y 15. Considere la gráfica de la figura 1.3, la cual 
ejemplifica la detección de la interacción entre dos factores en un diseño experimental 
simple. Observe que las líneas que conectan las medias de la muestra no son paralelas. 
El paralelismo habría indicado que el efecto (visto como un resultado de la pendiente 
de las líneas) de la humedad relativa es igual, es decir, negativo, tanto en la condición sin 
recubrimiento como en la condición con recubrimiento químico contra la corrosión. 
Recuerde que la pendiente negativa implica que la corrosión se vuelve más pronunciada a 
medida que aumenta la humedad. La ausencia de paralelismo implica una interacción 
entre el tipo de recubrimiento y la humedad relativa. La línea casi “horizontal” para el 
recubrimiento contra la corrosión, opuesta a la pendiente más pronunciada para la con- 
dición sin recubrimiento, sugiere que el recubrimiento químico contra la corrosión no 
sólo es benéfico (observe el desplazamiento entre las líneas), sino que la presencia 
del recubrimiento revela que el efecto de la humedad es despreciable. Salta a la vista que 
todas estas cuestiones son muy importantes para el efecto de los dos factores individua- 
les y para la interpretación de la interacción, si está presente. 

Los modelos estadísticos son muy útiles para responder preguntas como las descritas 
en i, ii y iii, en donde los datos provienen de un diseño experimental. Sin embargo, no 
siempre se cuenta con el tiempo o los recursos que permiten usar un diseño experimen- 
tal. Por ejemplo, hay muchos casos en los que las condiciones de interés para el científico 
o el ingeniero simplemente no se pueden implementar debido a que es imposible controlar 
los factores importantes. En el ejemplo 1.3 la humedad relativa y el tipo de recubrimiento 
(o la ausencia de éste) son bastante fáciles de controlar. Desde luego, se trata del rasgo 
distintivo de un diseño experimental. En muchos campos los factores a estudiar no pue- 
den ser controlados por diversas razones. Un control riguroso como el del ejemplo 1.3 
permite al analista confiar en que las diferencias encontradas (como en los niveles de 
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corrosión) se deben a los factores que se pueden controlar. Considere el ejercicio 1.6 de la 
página 13 como otro ejemplo. En este caso suponga que se eligen 24 especímenes de 
caucho de silicio y que se asignan 12 a cada uno de los niveles de temperatura de vulca- 
nizado. Las temperaturas se controlan cuidadosamente, por lo que éste es un ejemplo de 
diseño experimental con un solo factor, que es la temperatura de vulcanizado. Se podría 
suponer que las diferencias encontradas en la media de la resistencia a la tensión son atri- 
buibles a las diferentes temperaturas de vulcanizado. 


¿Qué sucede si no se controlan los factores? 


Suponga que los factores no se controlan y que no hay asignación aleatoria a los trata- 
mientos específicos para las unidades experimentales, y que se necesita obtener informa- 
ción a partir de un conjunto de datos. Como ejemplo considere un estudio donde el interés 
se centra en la relación entre los niveles de colesterol sanguíneo y la cantidad de sodio 
medida en la sangre. Durante cierto periodo se revisó el colesterol sanguíneo y el nivel de 
sodio de un grupo de individuos. En efecto, es posible obtener alguna información útil 
de tal conjunto de datos. Sin embargo, debería quedar claro que no es posible hacer 
un control estricto de los niveles de sodio. De manera ideal, los sujetos deberían dividir- 
se aleatoriamente en dos grupos, donde uno fuera el asignado a un nivel alto específico 
de sodio en la sangre, y el otro a un nivel bajo específico de sodio en la sangre, pero es 
obvio que esto no es posible. Evidentemente los cambios en los niveles de colesterol se 
deben a cambios en uno o diversos factores que no se controlaron. Este tipo de estudio, 
sin control de factores, se denomina estudio observacional, el cual la mayoría de las 
veces implica una situación en que los sujetos se observan a través del tiempo. 

Los estudios biológicos y biomédicos a menudo tienen que ser observacionales. Sin 
embargo, este tipo de estudios no se restringen a dichas áreas. Por ejemplo, considere un 
estudio diseñado para determinar la influencia de la temperatura ambiental sobre la ener- 
gía eléctrica que consumen las instalaciones de una planta química. Es evidente que los 
niveles de la temperatura ambiental no se pueden controlar, por lo tanto, la única manera 
en que se puede supervisar la estructura de los datos es a partir de los datos de la planta 
a través del tiempo. 

Es importante destacar que una diferencia básica entre un experimento bien diseñado 
y un estudio observacional es la dificultad para determinar la causa y el efecto verdaderos 
con este último. Asimismo, las diferencias encontradas en la reacción fundamental (por 
ejemplo, niveles de corrosión, colesterol sanguíneo, consumo de energía eléctrica en una 
planta) podrían deberse a otros factores subyacentes que no se controlaron. De manera 
ideal, en un diseño experimental los factores perturbadores serían compensados me- 
diante el proceso de aleatoriedad. En realidad, los cambios en los niveles de colesterol 
sanguíneo podrían deberse a la ingestión de grasa, a la realización de actividad física, 
etc. El consumo de energía eléctrica podría estar afectado por la cantidad de bienes pro- 
ducidos o incluso por la pureza de éstos. 

Otra desventaja de los estudios observacionales, que a menudo se ignora cuando és- 
tos se comparan con experimentos cuidadosamente diseñados, es que, a diferencia de 
estos últimos, los observacionales están a merced de circunstancias no controladas, natu- 
rales, ambientales o de otros tipos, que repercuten en los niveles de los factores de interés. 
Por ejemplo, en el estudio biomédico acerca de la influencia de los niveles de sodio en la 
sangre sobre el colesterol sanguíneo es posible que haya, de hecho, una influencia sig- 
nificativa, pero el conjunto de datos específico usado no involucró la suficiente variación 
observada en los niveles de sodio debido a la naturaleza de los sujetos elegidos. Desde 
luego, en un diseño experimental el analista elige y controla los niveles de los factores. 
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Un tercer tipo de estudio estadístico que podría ser muy útil, pero que tiene notables 
desventajas cuando se le compara con un diseño experimental, es el estudio retrospec- 
tivo. Esta clase de estudio emplea estrictamente datos históricos, que se obtienen duran- 
te un periodo específico. Una ventaja evidente de los datos retrospectivos es el bajo 
costo de la recopilación de datos. Sin embargo, como se podría esperar, también tiene 
desventajas claras: 


1. La validez y la confiabilidad de los datos históricos a menudo son cuestionables. 


ii. Si el tiempo es un aspecto relevante en la estructura de los datos, podría haber 
datos faltantes. 


iii. Podrían existir errores en la recopilación de los datos que no se conocen. 


iv. De nuevo, como en el caso de los datos observacionales, no hay control en los 
rangos de las variables a medir (es decir, en los factores a estudiar). De hecho, 
las variaciones que se encuentran en los datos históricos a menudo no son sig- 
nificativas para estudios actuales. 


En la sección 1.6 se puso cierto énfasis en los modelos de las relaciones entre variables. 
Presentamos el concepto de análisis de regresión, el cual se estudia en los capítulos 11 y 12, 
y se considera como una forma del análisis de datos para los diseños experimentales que 
se examinarán en los capítulos 14 y 15. En la sección 1.6 se utilizó a modo de ejemplo 
un modelo que relaciona la media poblacional de la resistencia a la tensión de la tela con 
los porcentajes de algodón, en el cual 20 especímenes de tela representaban las unidades 
experimentales. En este caso, los datos provienen de un diseño experimental simple, en 
el que los porcentajes de algodón individuales fueron seleccionados por el científico. 

Con frecuencia, tanto los datos observacionales como los retrospectivos se utilizan 
para observar las relaciones entre variables a través de los procedimientos de construc- 
ción de modelos que se estudiarán en los capítulos 11 y 12. Aunque las ventajas de los 
diseños experimentales se pueden aplicar cuando la finalidad es la construcción de 
un modelo estadístico, hay muchas áreas en las que no es posible diseñar experimentos, 
de manera que habrá que utilizar los datos históricos u observacionales. Aquí nos refe- 
rimos al conjunto de datos históricos que se incluye en el ejercicio 12.5 de la página 450. 
El objetivo es construir un modelo que dé como resultado una ecuación o relación que 
vincule el consumo mensual de energía eléctrica con la temperatura ambiental promedio, 
x, el número de días en el mes, x,, la pureza promedio del producto, х, y las toneladas 
de bienes producidos, x as Se trata de los datos históricos del año anterior. 


1.13 Un fabricante de componentes electrónicos se inte- 
resa en determinar el tiempo de vida de cierto tipo de ba- 
tería. Una muestra, en horas de vida, es como la siguiente: 


123, 116, 122, 110, 175, 126, 125, 111, 118, 117. 


a) Calcule la media y la mediana de la muestra. 
b) ¿Qué característica en este conjunto de datos es la 
responsable de la diferencia sustancial entre ambas? 


1.14 Un fabricante de neumáticos quiere determinar 
el diámetro interior de un neumático de cierto grado de 
calidad. Idealmente el diámetro sería de 570 mm. Los 
datos son los siguientes: 


572, 572, 573, 568, 569, 575, 565, 570. 


a) Calcule la media y la mediana de Іа muestra. 

b) Obtenga la varianza, la desviación estándar y el 
rango de la muestra. 

с) Con base en los estadísticos calculados en los inci- 
sos а) y b), ¿qué comentaría acerca de la calidad 
de los neumáticos? 


1.15 Cinco lanzamientos independientes de una mo- 
neda tienen como resultado cinco caras. Resulta que si 
la moneda es legal, la probabilidad de este resultado es 
(1/2 = 0.03125. ¿Proporciona esto evidencia sólida 
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de que la moneda no es legal? Comente y utilice el con- 
cepto de valor-P que se analizó en la sección 1.1. 


1.16 Muestre que las n piezas de información en 


n 

Y (xi — X)? no son independientes; es decir, demues- 
і=1 
tre que 


№, (х: =) = 0. 
i=l 


1.17 Se realiza un estudio acerca de los efectos del 
tabaquismo sobre los patrones de sueño. La medición 
que se observa es el tiempo, en minutos, que toma que- 
dar dormido. Se obtienen los siguientes datos: 


Fumadores: 69.3 56.0 22.1 476 
53.2 48.1 52.7 344 
60.2 43.8 23.2 13.8 

No fumadores: 28.6 25.1 26.4 349 
29.8 28.4 38.5 302 
30.6 31.8 41.6 21.1 
36.0 37.9 139 


a) Calcule la media de la muestra para cada grupo. 

b) Calcule la desviación estándar de la muestra para 
cada grupo. 

c) Elabore una gráfica de puntos de los conjuntos de 
datos A y B en la misma línea. 

d) Comente qué clase de efecto parece tener el hecho 
de fumar sobre el tiempo que se requiere para que- 
darse dormido. 


1.18 Las siguientes puntuaciones representan la cali- 
ficación en el examen final para un curso de estadística 
elemental: 

23 60 79 32 57 74 52 70 82 

36 80 77 81 95 41 65 92 85 

55 76 52 10 64 75 78 25 80 

98 81 67 41 71 83 54 64 72 

88 62 74 43 60 78 89 76 84 

48 84 90 15 79 34 67 17 82 

69 74 63 80 85 6l 


a) Elabore un diagrama de tallo y hojas para las cali- 
ficaciones del examen, donde los tallos sean 1, 2, 
A 

b) Elabore un histograma de frecuencias relativas, 
trace un estimado de la gráfica de la distribución y 
analice la asimetría de la distribución. 

c) Calcule la media, la mediana y la desviación es- 
tándar de la muestra. 

1.19 Los siguientes datos representan la duración de 
vida, en años, medida al entero más cercano, de 30 
bombas de combustible similares. 


20 30 03 33 13 04 
02 60 55 65 02 23 
15 40 59 18 4.7 0.7 
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45 03 15 05 2.5 5.0 

10 60 56 60 1.2 0.2 

a) Construya un diagrama de tallo y hojas para la 
vida, en años, de las bombas de combustible, utili- 
zando el dígito a la izquierda del punto decimal 
como el tallo para cada observación. 

b) Determine una distribución de frecuencias relativas. 

c) Calcule la media, el rango y la desviación estándar 
de la muestra. 


1.20 Los siguientes datos representan la duración de 
la vida, en segundos, de 50 moscas de la fruta que 
se someten a un nuevo aerosol en un experimento de 
laboratorio controlado. 


17 20 10 9 23 13 12 19 18 24 
12 14 6 9 13 6 7 10 13 7 
16 18 8 3 3 32 9 7 10 11 
13 7 18 7 10 4 27 19 16 8 
7 10 5 14 15 10 9 6 7 15 


a) Elabore un diagrama doble de tallo y hojas para el 
periodo de vida de las moscas de la fruta usando 
los tallos Ож, 0°, 1%, 1,2%, 2. y 3% de manera 
que los tallos codificados con los símbolos Ж y + 
se asocien, respectivamente, con las hojas 0 a 4 y 
5a9. 

b) Determine una distribución de frecuencias relativas. 

c) Construya un histograma de frecuencias relativas. 

d) Calcule la mediana. 


1.21 La duración de fallas eléctricas, en minutos, se 
presenta en la siguiente tabla. 


22 18 135 15 90 78 69 98 102 
83 55 28 121 120 13 22 124 112 
70 66 74 89 103 24 21 112 21 
40 98 87 132 115 21 28 43 37 


50 96 118 158 74 78 83 93 95 


a) Calcule la media y la mediana muestrales de las 
duraciones de la falla eléctrica. 

b) Calcule la desviación estándar de las duraciones 
de la falla eléctrica. 


1.22 Los siguientes datos son las mediciones del diá- 
metro de 36 cabezas de remache en centésimos de una 


pulgada. 
6.72 6.77 6.82 6.70 6.78 6.70 6.62 6.75 
6.66 6.66 6.64 6.76 6.73 6.80 6.72 6.76 
6.76 6.68 6.66 6.62 6.72 6.76 6.70 6.78 
6.76 6.67 6.70 6.72 6.74 6.81 6.79 6.78 
6.66 6.76 6.76 6.72 
a) Calcule la media y la desviación estándar de la 
muestra. 


b) Construya un histograma de frecuencias relativas 
para los datos. 
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c) Comente si existe o no una indicación clara de que 
la muestra proviene de una población que tiene 
una distribución en forma de campana. 


1.23 En 20 automóviles elegidos aleatoriamente, se 
tomaron las emisiones de hidrocarburos en velocidad 
en vacío, en partes por millón (ppm), para modelos de 
1980 y 1990. 


Modelos 1980: 
141 359 247 940 882 494 306 210 105 880 
200 223 188 940 241 190 300 435 241 380 
Modelos 1990: 
140 160 20 20 223 60 20 95 360 70 
220 400 217 58 235 380 200 175 85 65 


a) Construya una gráfica de puntos como la de la fi- 
gura 1.1. 

b) Calcule la media de la muestra para los dos años y 
sobreponga las dos medias en las gráficas. 

с) Comente sobre lo que indica la gráfica de puntos 
respecto de si cambiaron o no las emisiones po- 
blacionales de 1980 a 1990. Utilice el concepto de 
variabilidad en sus comentarios. 

1.24 Los siguientes son datos históricos de los suel- 
dos del personal (dólares por alumno) en 30 escuelas 
seleccionadas de la región este de Estados Unidos a 
principios de la década de 1970. 


3.79 2.99 2.77 2.91 3.10 1.84 2.52 3.22 
2.45 2.14 2.67 2.52 2.71 2.75 3.57 3.85 
3.36 2.05 2.89 2.83 3.13 2.44 2.10 3.71 
3.14 3.54 2.37 2.68 3.51 3.37 


a) Calcule la media y la desviación estándar de la 
muestra. 

b) Utilice los datos para elaborar un histograma de 
frecuencias relativas. 

c) Construya un diagrama de tallo y hojas con los datos. 


1.25 El siguiente conjunto de datos se relaciona con 
el ejercicio 1.24 y representa el porcentaje de las fami- 
lias que se ubican en el nivel superior de ingresos en las 
mismas escuelas individuales y con el mismo orden del 
ejercicio 1.24. 


72.2 31.9 26.5 29.1 27.3 
20.4 12.8 25.1 19.2 24.1 
55.1 9.4 14.5 13.9 207 
38.1 54.2 21.5 26.2 59.1 4 


а) Calcule la media de Іа muestra. 

b) Calcule la mediana de la muestra. 

c) Construya un histograma de frecuencias relativas 
con los datos. 

d) Determine la media recortada al 10%. Compárela 
con los resultados de los incisos a) y b) y exprese 
su comentario. 


8.6 22.3 26.5 
58.2 68.1 89.2 
17.9 8.5 55.4 
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1.26 Suponga que le interesa emplear los conjuntos de 
datos de los ejercicios 1.24 y 1.25 para derivar un modelo 


que prediga los salarios del personal como una función 
del porcentaje de familias en un nivel alto de ingresos 
para los sistemas escolares actuales. Comente sobre cual- 
quier desventaja de llevar a cabo este tipo de análisis. 


1.27 Se realizó un estudio para determinar la influen- 
cia del desgaste, y, de un cojinete como una función de 
la carga, x, sobre el cojinete. Para este estudio se utilizó 
un diseño experimental con tres niveles de carga: 700 lb, 
1000 lb y 1300 lb. En cada nivel se utilizaron cuatro 
especímenes y las medias muestrales fueron 210, 325 y 
375, respectivamente. 

a) Grafique el promedio de desgaste contra la carga. 

b) A partir de la gráfica del inciso a), ¿consideraría 
que hay una relación entre desgaste y carga? 

c) Suponga que tenemos los siguientes valores indi- 
viduales de desgaste para cada uno de los cuatro 
especímenes en los respectivos niveles de carga. 
(Vea los datos que siguen). Grafique los resultados 
de desgaste para todos los especímenes contra los 
tres valores de carga. 

d) A partir de la gráfica del inciso c), ¿consideraría 
que hay una relación clara? Si su respuesta difiere 
de la del inciso b), explique por qué. 


X 
700 1000 1300 
yı 145 250 150 
y 105 195 180 
y | 260 375 420 
ya | 330 480 750 
y, =210 y,=325 ӱз = 375 


1.28 En Estados Unidos y otros países muchas com- 
pañías de manufactura utilizan partes moldeadas como 
componentes de un proceso. La contracción a menudo 
es un problema importante. Por consiguiente, un dado 
de metal moldeado para una parte se construye más 
grande que el tamaño nominal con el fin de permitir su 
contracción. En un estudio de moldeado por inyección 
se descubrió que en la contracción influyen múltiples 
factores, entre los cuales están la velocidad de la inyec- 
ción en pies/segundo y la temperatura de moldeado en 
°С. Los dos conjuntos de datos siguientes muestran los 
resultados del diseño experimental, en donde la veloci- 
dad de inyección se mantuvo a dos niveles (bajo y alto) 
y la temperatura de moldeado se mantuvo constante en 
un nivel bajo. La contracción se midió en ст x 10%, 
Los valores de contracción a una velocidad de inyec- 
ción baja fueron: 

72.68 72.62 72.58 72.48 73.07 

72.55 72.42 72.84 72.58 72.92 


Los valores de contracción a una velocidad de inyec- 
ción alta fueron: 


71.62 71.68 71.74 71.48 71.55 
71.52 71.71 71.56 71.70 71.50 


Ejercicios 


a) Construya una gráfica de puntos para ambos con- 
juntos de datos en la misma gráfica. Sobre ésta 
indique ambas medias de la contracción, tanto 
para la velocidad de inyección baja como para la 
velocidad de inyección alta. 

b) Con base en los resultados de la gráfica del inciso 
a), y considerando la ubicación de las dos medias 
y su sentido de variabilidad, ¿cuál es su conclusión 
respecto del efecto de la velocidad de inyección 
sobre la contracción a una temperatura de moldea- 
do baja? 


1.29 Utilice los datos del ejercicio 1.24 para elaborar 
una gráfica de caja. 


1.30 A continuación se presentan los tiempos de 
vida, en horas, de 50 lámparas incandescentes, con 
esmerilado interno, de 40 watts y 110 voltios, los cua- 
les se tomaron de pruebas forzadas de vida: 


919 1196 785 1126 936 918 
1156 920 948 1067 1092 1162 
1170 929 950 905 972 1035 
1045 855 1195 1195 1340 1122 
938 970 1237 956 1102 1157 
978 832 1009 1157 1151 1009 
765 958 902 1022 1333 811 
1217 1085 896 958 1311 1037 
702 923 


Elabore una gráfica de puntos para estos datos. 


1.31 Considere la situación del ejercicio 1.28, pero 
ahora utilice el siguiente conjunto de datos, en el cual 
la contracción se mide de nuevo a una velocidad de in- 
yección baja y a una velocidad de inyección alta. Sin 
embargo, esta vez la temperatura de moldeado se au- 
menta a un nivel “alto” y se mantiene constante. 


Los valores de la contracción a una velocidad de inyec- 
ción baja fueron: 

76.20 76.09 75.98 76.15 76.17 

75.94 76.12 76.18 76.25 75.82 
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Los valores de la contracción a una velocidad de inyec- 
ción alta fueron: 


93.25 93.19 92.87 93.29 93.37 
92.98 93.47 93.75 93.89 91.62 


a) Igual que en el ejercicio 1.28, elabore una gráfica 
de puntos con ambos conjuntos de datos en la mis- 
ma gráfica e identifique las dos medias (es decir, la 
contracción media para la velocidad de inyección 
baja y para la velocidad de inyección alta). 

b) Igual que en el ejercicio 1.28, comente sobre la 
influencia de la velocidad de inyección en la con- 
tracción para la temperatura de moldeado alta. 
Tome en cuenta la posición de las dos medias y la 
variabilidad de cada media. 

с) Compare su conclusión en el inciso b) actual con 
la del inciso b) del ejercicio 1.28, en el cual la tem- 
peratura de moldeado se mantuvo a un nivel bajo. 
¿Diría que hay interacción entre la velocidad de 
inyección y la temperatura de moldeado? Expli- 
que su respuesta. 


1.32 Utilice los resultados de los ejercicios 1.28 y 
1.31 para crear una gráfica que ilustre la interacción 
evidente entre los datos. Use como guía la gráfica de la 
figura 1.3 del ejemplo 1.3. ¿El tipo de información que 
se encontró en los ejercicios 1.28 y 1.31 se habría en- 
contrado en un estudio observacional en el que el ana- 
lista no hubiera tenido control sobre la velocidad de 
inyección ni sobre la temperatura de moldeado? Expli- 
que su respuesta. 


1.33 Proyecto de grupo: Registre el tamaño de cal- 
zado que usa cada estudiante de su grupo. Utilice las 
medias y las varianzas muestrales, así como los tipos 
de gráficas que se estudiaron en este capítulo, para re- 
sumir cualquier característica que revele una diferencia 
entre las distribuciones del tamaño del calzado de hom- 
bres y mujeres. Haga lo mismo con la estatura de cada 
estudiante de su grupo. 


Capítulo 2 


Probabilidad 


2.1 Espacio muestral 


En el estudio de la estadística tratamos básicamente con la presentación e interpretación 
de resultados fortuitos que ocurren en un estudio planeado o en una investigación cien- 
tífica. Por ejemplo, en Estados Unidos, y con la finalidad de justificar la instalación de 
un semáforo, se podría registrar el número de accidentes que ocurren mensualmente en 
la intersección de Driftwood Lane y Royal Oak Drive; en una fábrica se podrían clasifi- 
car los artículos que salen de la línea de ensamble como “defectuosos” o “no defectuo- 
sos”; en una reacción química se podría revisar el volumen de gas que se libera cuando 
se varía la concentración de un ácido. Por ello, quienes se dedican a la estadística a me- 
nudo manejan datos numéricos que representan conteos o mediciones, o datos categó- 
ricos que se podrían clasificar de acuerdo con algún criterio. 

En este capítulo, al referirnos a cualquier registro de información, ya sea numérico o 
categórico, utilizaremos el término observación. Por consiguiente, los números 2, 0, 1 y 
2, que representan el número de accidentes que ocurrieron cada mes, de enero a abril, 
durante el año pasado en la intersección de Driftwood Lane y Royal Oak Drive, constitu- 
yen un conjunto de observaciones. Lo mismo ocurre con los datos categóricos N, D, N, N 
y D, que representan los artículos defectuosos o no defectuosos cuando se inspeccionan 
cinco artículos y se registran como observaciones. 

Los estadísticos utilizan la palabra experimento para describir cualquier proceso que 
genere un conjunto de datos. Un ejemplo simple de experimento estadístico es el lanza- 
miento de una moneda al aire. En tal experimento sólo hay dos resultados posibles: cara 
о cruz. Otro experimento podría ser el lanzamiento de un misil y la observación de la 
velocidad a la que se desplaza en tiempos específicos. Las opiniones de los votantes res- 
pecto de un nuevo impuesto sobre las ventas también se pueden considerar como obser- 
vaciones de un experimento. En estadística nos interesan, en particular, las observaciones 
que se obtienen al repetir varias veces un experimento. En la mayoría de los casos los 
resultados dependerán del azar, por lo tanto, no se pueden predecir con certeza. Si un 
químico realizara un análisis varias veces en las mismas condiciones, obtendría diferentes 
medidas, las cuales indicarían un elemento de probabilidad en el procedimiento experi- 
mental. Aun cuando lancemos una moneda al aire repetidas veces, no podemos tener la 
certeza de que en un lanzamiento determinado obtendremos cara como resultado. Sin 
embargo, conocemos el conjunto completo de posibilidades para cada lanzamiento. 

Dado lo expuesto en la sección 1.7, en la que se revisaron tres tipos de estudios esta- 
dísticos y se dieron varios ejemplos de cada uno, ya deberíamos estar familiarizados con 
el alcance del término experimento. En cada uno de los tres casos, diseños experimenta- 
les, estudios observacionales y estudios retrospectivos, el resultado final fue un conjunto 
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de datos que, por supuesto, está sujeto a la incertidumbre. Aunque sólo uno de ellos 
tiene la palabra experimento en su descripción, el proceso de generar los datos o el proce- 
so de observarlos forma parte de un experimento. El estudio de la corrosión expuesto en 
la sección 1.2 ciertamente implica un experimento en el que los datos son representados 
por las mediciones de la corrosión. El ejemplo de la sección 1.7, en el que se observó el 
colesterol y el sodio en la sangre de un conjunto de individuos, representó un estudio 
observacional (como lo opuesto a un diseño experimental) en el que el proceso incluso 
generó datos y un resultado sujeto a la incertidumbre; por lo tanto, se trata de un experi- 
mento. Un tercer ejemplo en la sección 1.7 consistió en un estudio retrospectivo, en el cual 
se observaron datos históricos sobre el consumo de energía eléctrica por mes y el prome- 
dio mensual de la temperatura ambiental. Aun cuando los datos pueden haber estado 
archivados durante décadas, el proceso se seguirá considerando un experimento. 


Al conjunto de todos los resultados posibles de un experimento estadístico se le llama 
espacio muestral y se representa con el símbolo 5. 


A cada resultado en un espacio muestral se le llama elemento o miembro del espa- 
cio muestral, o simplemente punto muestral. Si el espacio muestral tiene un número 
finito de elementos, podemos listar los miembros separados por comas y encerrarlos 
entre llaves. Por consiguiente, el espacio muestral S, de los resultados posibles cuando 
se lanza una moneda al aire, se puede escribir como 


S= {H, T}, 


en donde H y T corresponden a “caras” y “cruces”, respectivamente. 


Ejemplo 2.1: | Considere el experimento de lanzar un dado. Si nos interesara el número que aparece en 


la cara superior, el espacio muestral sería 
$ = {1, 2, 3, 4,5, 6) 


Si sólo estuviéramos interesados en si el número es par o impar, el espacio muestral sería 
simplemente 
S, = [par, impar] JJ 


El ejemplo 2.1 ilustra el hecho de que se puede usar más de un espacio muestral para 
describir los resultados de un experimento. En este caso, 5, brinda más información que 
5,. Si sabemos cuál elemento ocurre en $, podremos indicar cuál resultado tiene lugar 
en S,; no obstante, saber lo que pasa en 5, no ayuda mucho a determinar qué elemento 
ocurre en $, . En general, lo deseable sería utilizar un espacio muestral que proporcione 
la mayor información acerca de los resultados del experimento. En algunos experimen- 
tos es útil listar los elementos del espacio muestral de forma sistemática utilizando un 
diagrama de árbol. 


Ejemplo 2.2: 


Un experimento consiste en lanzar una moneda y después lanzarla una segunda vez si sale 
cara. Si en el primer lanzamiento sale cruz, entonces se lanza un dado una vez. Para listar 
los elementos del espacio muestral que proporciona la mayor información construimos 
el diagrama de árbol de la figura 2.1. Las diversas trayectorias a lo largo de las ramas del 
árbol dan los distintos puntos muestrales. Si empezamos con la rama superior izquierda 
y nos movemos a la derecha a lo largo de la primera trayectoria, obtenemos el punto 
muestral AH, que indica la posibilidad de que ocurran caras en dos lanzamientos sucesi- 
vos de la moneda. De igual manera, el punto muestral 73 indica la posibilidad de que la 
moneda muestre una cruz seguida por un 3 en el lanzamiento del dado. Al seguir todas 
las trayectorias, vemos que el espacio muestral es 
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Primer Segundo Punto 
resultado resultado muestral 
H HH 
H 
T HT 
1 Ti 
2 T2 
3 T3 
T 
4 T4 
5 T5 
6 T6 


Figura 2.1: Diagrama de árbol para el ejemplo 2.2. 


S = (HH, HT, T1, T2, ТЗ, ТА, Т5, T6}. JJ 


Muchos de los conceptos de este capítulo se ilustran mejor con ejemplos que in- 
volucran el uso de dados y cartas. Es particularmente importante utilizar estas aplicacio- 
nes al comenzar el proceso de aprendizaje, ya que facilitan el flujo de esos conceptos 
nuevos en ejemplos científicos y de ingeniería como el siguiente. 


Ejemplo 2.3: | Suponga que se seleccionan, de forma aleatoria, tres artículos de un proceso de fabrica- 
ción. Cada artículo se inspecciona y se clasifica como defectuoso, D, o no defectuoso, М. 
Para listar los elementos del espacio muestral que brinde la mayor información, cons- 
truimos el diagrama de árbol de la figura 2.2, de manera que las diversas trayectorias a 
lo largo de las ramas del árbol dan los distintos puntos muestrales. Al comenzar con la 
primera trayectoria, obtenemos el punto muestral DDD, que indica la posibilidad de que 
los tres artículos inspeccionados estén defectuosos. Conforme continuamos a lo largo de 
las demás trayectorias, vemos que el espacio muestral es 


S ={ DDD, DDN, DND, DNN, NDD, NDN, NND, NNN}. J 


Los espacios muestrales con un número grande o infinito de puntos muestrales se 
describen mejor mediante un enunciado o método de la regla. Por ejemplo, si el con- 
junto de resultados posibles de un experimento fuera el conjunto de ciudades en el mun- 
do con una población de más de un millón de habitantes, nuestro espacio muestral se 
escribiría como 


S = {x | x es una ciudad con una población de más de un millón de habitantes), 


que se lee “S es el conjunto de todas las x, tales que x es una ciudad con una población 
de más de un millón de habitantes”. La barra vertical se lee como “tal que”. De manera 
similar, si S es el conjunto de todos los puntos (x, y) sobre los límites o el interior de un 
círculo de radio 2 con centro en el origen, escribimos la regla 


$ = {(х,у)1 2 +y < 4}. 
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Primer Segundo Tercer Punto 
artículo artículo artículo muestral 
D DDD 
D 
D М DDN 
D DND 
М 
М DNN 
D NDD 
D 
N М МОМ 
D NND 
М 
М МММ 


Figura 2.2: Diagrama de árbol para el ejemplo 2.3. 


Nuestra elección respecto a describir el espacio muestral utilizando el método de la 
regla o listando los elementos dependerá del problema específico en cuestión. El método 
de la regla tiene ventajas prácticas, sobre todo en el caso de muchos experimentos en los 
que listar se vuelve una tarea tediosa. 

Considere la situación del ejemplo 2.3, en el que los artículos que salen del proceso 
de fabricación están defectuosos, D, o no defectuosos, N. Hay muchos procedimientos 
estadísticos importantes llamados planes de muestreo, que determinan si un “lote” de 
artículos se considera o no satisfactorio. Este tipo de planes implican tomar muestras 
hasta obtener k artículos defectuosos. Suponga que el experimento consiste en tomar 
muestras de artículos, de forma aleatoria, hasta que salga uno defectuoso. En este caso 
el espacio muestral sería 

S = {D, ND, NND, NNND).,...). 


2.2 Eventos 


En cualquier experimento dado, podríamos estar interesados en la ocurrencia de ciertos 
eventos, más que en la ocurrencia de un elemento específico en el espacio muestral. Por 
ejemplo, quizás estemos interesados en el evento A, en el cual el resultado de lanzar un 
dado es divisible entre 3. Esto ocurrirá 51 el resultado es un elemento del subconjunto 
A = {3, 6} del espacio muestral S, del ejemplo 2.1. Otro ejemplo: podríamos estar inte- 
resados en el evento B de que el número de artículos defectuosos sea mayor que 1 en el 
ejemplo 2.3. Esto ocurrirá si el resultado es un elemento del subconjunto 


В = (DDN, DND, NDD, DDD) 
del espacio muestral S. 
Para cada evento asignamos un conjunto de puntos muestrales, que constituye un 
subconjunto del espacio muestral. Este subconjunto representa la totalidad de los ele- 
mentos para los que el evento es cierto. 
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Definición 2.2: Un evento es un subconjunto de un espacio muestral. 


Ejemplo 2.4: | Dado el espacio muestral 5 = {т1т 2 0), donde ż es la vida en años de cierto componen- 
te electrónico, el evento A de que el componente falle antes de que finalice el quinto año 
es el subconjunto A = {t10 < t < 5}. И | 


Es posible concebir que un evento puede ser un subconjunto que incluye todo el 
espacio muestral 5, o un subconjunto de 5 que se denomina conjunto vacío y se denota 
con el símbolo ф, que no contiene ningún elemento. Por ejemplo, si en un experimento 
biológico permitimos que А sea el evento de detectar un organismo microscópico a sim- 
ple vista, entonces A =ф. También, si 


B = {x | x es un factor par de 7), 


entonces B debe ser el conjunto vacío, pues los únicos factores posibles de 7 son los 
números nones 1 y 7. 

Considere un experimento en el que se registran los hábitos de tabaquismo de los 
empleados de una empresa industrial. Un posible espacio muestral podría clasificar a un 
individuo como no fumador, fumador ocasional, fumador moderado o fumador empe- 
dernido. Si se determina que el subconjunto de los fumadores sea un evento, entonces la 
totalidad de los no fumadores corresponderá a un evento diferente, también subconjunto 
de S, que se denomina complemento del conjunto de fumadores. 


Definición 2.3: El complemento de un evento A respecto de S es el subconjunto de todos los elementos 
de S que no están en A. Denotamos el complemento de A mediante el símbolo A”. 


Ejemplo 2.5: | Sea R el evento de que se seleccione una carta roja de una baraja ordinaria de 52 cartas, 
y sea S toda la baraja. Entonces R’ es el evento de que la carta seleccionada de la baraja 
no sea una roja sino una negra. | 


Ejemplo 2.6: | Considere el espacio muestral 
S = [libro, teléfono celular, mp3, papel, papelería, computadora). 


Sea A = (libro, papelería, computadora, papel). Entonces, el complemento de A es A’ = 
[teléfono celular, mp3). И | 

Consideremos ahora ciertas Operaciones con eventos que darán como resultado la 
formación de nuevos eventos. Estos eventos nuevos serán subconjuntos del mismo es- 
pacio muestral que los eventos dados. Suponga que A y B son dos eventos que se asocian 
con un experimento. En otras palabras, A y B son subconjuntos del mismo espacio mues- 
tral S. Por ejemplo, en el lanzamiento de un dado podríamos hacer que A sea el evento 
de que ocurra un número par y B el evento de que aparezca un número mayor que 3. 
Entonces, los subconjuntos A = {2,4,6} y B = (4, 5, 6} son subconjuntos del mismo 
espacio muestral 

S = {1, 2, 3, 4, 5, 6}. 


Observe que tanto A como B ocurrirán en un lanzamiento dado si el resultado es un ele- 
mento del subconjunto (4, 6), el cual es precisamente la intersección de A y B. 


Definición 2.4: La intersección de dos eventos A y B, que se denota con el símbolo A N B, es el even- 
to que contiene todos los elementos que son comunes a A y a B. 


Ejemplo 2.7: | Sea E el evento de que una persona seleccionada al azar en un salón de clases sea estu- 
diante de ingeniería, y sea F el evento de que la persona sea mujer. Entonces EN F es el 
evento de todas las estudiantes mujeres de ingeniería en el salón de clases. И | 
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Ejemplo 2.8: | Sean V = fa, e, i, o, u} y C = [L, 1, s, 1}; entonces, se deduce que V N С = ф. Es decir, V 


Definición 2.5: 


у C no tienen elementos comunes, por lo tanto, no pueden ocurrir de forma simultánea. M 

Para ciertos experimentos estadísticos no es nada extraño definir dos eventos, A y 
B, que no pueden ocurrir de forma simultánea. Se dice entonces que los eventos A y B 
son mutuamente excluyentes. Expresado de manera más formal, tenemos la siguiente 
definición: 


Dos eventos A у B son mutuamente excluyentes o disjuntos si А N B = ф; es decir, 
si A y B no tienen elementos en común. 


Ejemplo 2.9: | Una empresa de televisión por cable ofrece programas en ocho diferentes canales, tres 


Definición 2.6: 


de los cuales están afiliados con ABC, dos con NBC y uno con CBS. Los otros dos son 
un canal educativo y el canal de deportes ESPN. Suponga que un individuo que se sus- 
cribe a este servicio enciende un televisor sin seleccionar de antemano el canal. Sea A el 
evento de que el programa pertenezca a la cadena NBC y B el evento de que pertenezca 
a la cadena CBS. Como un programa de televisión no puede pertenecer a más de una 
cadena, los eventos A y B no tienen programas en común. Por lo tanto, la intersección 
A N B no contiene programa alguno y, en consecuencia, los eventos A y B son mutua- 
mente excluyentes. J 
A menudo nos interesamos en la ocurrencia de al menos uno de dos eventos asociados 
con un experimento. Por consiguiente, en el experimento del lanzamiento de un dado, si 


А = {2,4,6} y B = {4,5,6}, 


podríamos estar interesados en que ocurran A o B, o en que ocurran tanto A como B. Tal 
evento, que se llama unión de A y B, ocurrirá si el resultado es un elemento del subcon- 
junto {2, 4, 5, 6}. 


La unión de dos eventos A y B, que se denota con el símbolo A U B, es el evento que 
contiene todos los elementos que pertenecen a A o a B, o a ambos. 


Ejemplo 2.10: 


Sea A = {a, b, c} y B = {b, c, d, e}; entonces, A U B = {a, b, c, d, e}. И | 


Ejemplo 2.11: 


Sea P el evento de que un empleado de una empresa petrolera seleccionado al azar fume 
cigarrillos. Sea О el evento de que el empleado seleccionado ingiera bebidas alcohólicas. 
Entonces, el evento P U О es el conjunto de todos los empleados que beben o fuman, o 
que hacen ambas cosas. JJ 


Ejemplo 2.12: [SiM = {xl3<x<9}yN= {y|5 < y< 12}, entonces, 


МОМ = {213 <z < 12}. JJ 


La relación entre eventos y el correspondiente espacio muestral se puede ilustrar de 
forma gráfica utilizando diagramas de Venn. En un diagrama de Venn representamos el 
espacio muestral como un rectángulo y los eventos con círculos trazados dentro del rec- 
tángulo. De esta forma, en la figura 2.3 vemos que 


AN В = regiones 1 y 2, 
В П C = regiones 1 y 3, 


2.2 Eventos 
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Figura 2.3: Eventos representados por varias regiones. 


А U C = regiones 1, 2, 3, 4, 5 у7, 
В'П А = regiones 4 у 7, 
АП ВГ) С = región 1, 
(A U B) П C = regiones 2, 6 y 7, 


y así sucesivamente. 


Figura 2.4: Eventos del espacio muestral S. 


En la figura 2.4 vemos que los eventos A, B y C son subconjuntos del espacio mues- 
tral 5. También es claro que el evento В es un subconjunto del evento A; el evento B N C 
no tiene elementos, por lo tanto, B y C son mutuamente excluyentes; el evento A N C 
tiene al menos un elemento; y el evento A U В = A. Por consiguiente, la figura 2.4 podría 
representar una situación en la que se selecciona una carta al azar de una baraja ordinaria 
de 52 cartas y se observa si ocurren los siguientes eventos: 


A: la carta es roja, 
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B: la carta es la jota, la reina o el rey de diamantes, 


C: la carta es un as. 


Claramente, el evento A N C consta sólo de los dos ases rojos. 
Varios resultados que se derivan de las definiciones precedentes, y que se pueden 
verificar de forma sencilla empleando diagramas de Venn, son como los que siguen: 


1. Апф= ф. 
2. AUQH=A. 
3. АпА'= ф. 
4. AUA'=S. 
5. 5 = ф. 


Ejercicios 


2.1 Liste los elementos de cada uno de los siguientes 
espacios muestrales: 

a) el conjunto de números enteros entre 1 y 50 que 
son divisibles entre 8; 

b) el conjunto S = [x1x? + 4x-5 = 0}; 

c) el conjunto de resultados cuando se lanza una mo- 
neda al aire hasta que aparecen una cruz o tres 
caras; 

d) el conjunto S = (x | x es un continente); 

е) el conjunto 5 = [x12x-4>0yx < 1). 


2.2 Utilice el método de la regla para describir el es- 
pacio muestral 5, que consta de todos los puntos del 
primer cuadrante dentro de un círculo de radio 3 con 
centro en el origen. 


2.3 ¿Cuáles de los siguientes eventos son iguales? 
a) A= (1,3); 
b) В = {x| x es un número de un dado); 
с) С={х\х?—-4х+3=0}; 
d) D = {x |x es el número de caras cuando se lanzan 
seis monedas al aire}. 


2.4 Un experimento implica lanzar un par de dados, 
uno verde y uno rojo, y registrar los números que re- 
sultan. Si x es igual al resultado en el dado verde y 
y es el resultado en el dado rojo, describa el espacio 
muestral S 

a) mediante la lista de los elementos (x, y); 

b) por medio del método de la regla. 


2.5 Un experimento consiste en lanzar un dado y des- 
pués lanzar una moneda una vez si el número en el 
dado es par. Si el número en el dado es impar, la mone- 
da se lanza dos veces. Use la notación 4H, por ejemplo, 
para denotar el resultado de que el dado muestre 4 y 
después la moneda caiga en cara, y 3HT para denotar el 
resultado de que el dado muestre 3, seguido por una 
cara y después una cruz en la moneda; construya un 


6. ф =S. 
7. (А) =A. 
8. (AN BY =A'UB'. 
9. (АОВ) = А'ПВ.. 


diagrama de árbol para mostrar los 18 elementos del 
espacio muestral 5. 


2.6 De un grupo de cuatro suplentes se seleccionan 
dos jurados para servir en un juicio por homicidio. Uti- 
lice la notación A,A,, por ejemplo, para denotar el even- 
to simple de que se seleccionen los suplentes 1 y 3, 


liste los б elementos del espacio muestral 5. 


2.7 De un grupo de estudiantes de química se selec- 
cionan cuatro al azar y se clasifican como hombre o 
mujer. Liste los elementos del espacio muestral S, 
usando la letra H para hombre y M para mujer. Defina 
un segundo espacio muestral S, donde los elementos 
representen el número de mujeres seleccionadas. 


2.8 Para el espacio muestral del ejercicio 2.4, 
a) liste los elementos que corresponden al evento A 
de que la suma sea mayor que 8; 
b) liste los elementos que corresponden al evento B 
de que ocurra un 2 en cualquiera de los dos dados; 
c) liste los elementos que corresponden al evento С 
de que salga un número mayor que 4 en el dado 
verde; 
d) liste los elementos que corresponden al evento 
ANC; 
e) liste los elementos que corresponden al evento 
ANB; 
f) liste los elementos que corresponden al evento 
BAC; 
g) construya un diagrama de Venn para ilustrar las 
intersecciones y uniones de los eventos A, B y C. 


2.9 Para el espacio muestral del ejercicio 2.5, 
a) liste los elementos que corresponden al evento A 
en el que el dado salga un número menor que 3; 
b) liste los elementos que corresponden al evento B 
de que resulten 2 cruces; 
c) liste los elementos que corresponden al evento A”; 
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d) liste los elementos que corresponden al evento 
АПВ; 

е) liste los elementos que corresponden al evento 
AUB. 


2.10 Se contrata a una empresa de ingenieros para 
que determine si ciertas vías fluviales en Virginia, Esta- 
dos Unidos, son seguras para la pesca. Se toman mues- 
tras de tres ríos. 

a) Liste los elementos de un espacio muestral 5 y uti- 
lice las letras P para “seguro para la pesca” y N 
para “inseguro para la pesca”. 

b) Liste los elementos de S que correspondan al even- 
to E de que al menos dos de los ríos son seguros 
para la pesca. 

с) Defina un evento que tiene como elementos a los 
puntos 


(PPP, NPP, PPN, NPN} 


2.11 El currículum de dos aspirantes masculinos para 
el puesto de profesor de química en una facultad se co- 
loca en el mismo archivo que el de dos aspirantes mu- 
jeres. Hay dos puestos disponibles y el primero, con el 
rango de profesor asistente, se cubre seleccionando al 
azar a uno de los cuatro aspirantes. El segundo puesto, 
con el rango de profesor titular, se cubre después me- 
diante la selección aleatoria de uno de los tres aspiran- 
tes restantes. Utilice la notación H,M,, por ejemplo, 
para denotar el evento simple de que el primer puesto 
se cubra con el segundo aspirante hombre y el segundo 
puesto se cubra después con la primera aspirante mujer, 

а) liste los elementos de un espacio muestral 5; 

b) liste los elementos de S que corresponden al even- 
to A en que el puesto de profesor asistente se cubre 
con un aspirante hombre; 

c) liste los elementos de S que corresponden al even- 
to B en que exactamente 1 de los 2 puestos se cu- 
bre con un aspirante hombre; 

d) liste los elementos de S que corresponden al even- 
to C en que ningún puesto se cubre con un aspiran- 
te hombre; 

e) liste los elementos de $ que corresponden al even- 
toA NB; 

f) liste los elementos de S que corresponden al even- 
toA UC; 

g) construya un diagrama de Venn para ilustrar las in- 
tersecciones y las uniones de los eventos A, B y C. 


2.12 Se estudian el ejercicio y la dieta como posibles 
sustitutos del medicamento para bajar la presión san- 
guínea. Se utilizarán tres grupos de individuos para es- 
tudiar el efecto del ejercicio. Los integrantes del grupo 
uno son sedentarios, los del dos caminan y los del tres 
nadan una hora al día. La mitad de cada uno de los 
tres grupos de ejercicio tendrá una dieta sin sal. Un gru- 
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po adicional de individuos no hará ejercicio ni restrin- 
girá su consumo de sal, pero tomará el medicamento 
estándar. Use Z para sedentario, С para caminante, < 
para nadador, Y para sal, N para sin sal, M para medica- 
mento y F para sin medicamento. 
a) Muestre todos los elementos del espacio muestral 5. 
b) Dado que A es el conjunto de individuos sin medi- 
camento y B es el conjunto de caminantes, liste los 
elementos de A U В. 
c) Liste los elementos de A N B. 


2.13 Construya un diagrama de Venn para ilustrar las 
posibles intersecciones y uniones en los siguientes 
eventos relativos al espacio muestral que consta de to- 
dos los automóviles fabricados en Estados Unidos. 


С: cuatro puertas, T: techo corredizo, D: dirección hi- 
dráulica 


2.14 SiS=(0,1,2,3,4,5,6,7,8,9) y A = {0, 2, 4, 
6,8), B = {1, 3,5,7,9}, C = {2, 3,4,5} y D = {1, 6, 
7}, liste los elementos de los conjuntos que correspon- 
den a los siguientes eventos: 

a) AUC; 

b) АПВ; 

в) С? 

d) (C'AN D) ОВ; 

e) (SNC); 

N ANCAP. 


2.15 Considere el espacio muestral § = {cobre, so- 
dio, nitrógeno, potasio, uranio, oxígeno, cinc} y los 
eventos 


A = {cobre, sodio, cinc}, 
B = {sodio, nitrógeno, potasio) 
C = {oxígeno}. 


Liste los elementos de los conjuntos que corresponden 
a los siguientes eventos: 

а) А” 

b) AUC; 

с) ANB)UC'; 

а) ВГС; 

e) ANBNC; 

P WUB)N(AN С). 


216 SiS=(xl0<x<12)M= (x|1<x<9) y 
N = {x10 < x < 5), encuentre 

a) МОМ; 

b) MAN, 

с) MAN. 
2.17 Sean A, B y C eventos relativos al espacio mues- 
tral 5. Utilice diagramas de Venn para sombrear las 
áreas que representan los siguientes eventos: 

а) (AABY; 

b) (АОВ); 

c) АПС) ЧОВ. 
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2.18 


¿Cuál de los siguientes pares de eventos son mu- 


tuamente excluyentes? 


a) 


b) 


с) 
а) 


Un golfista que se clasifica en último lugar en la 
vuelta del hoyo 18, en un torneo de 72 hoyos, y 
pierde el torneo. 

Un jugador de póquer que tiene flor (todas las car- 
tas del mismo palo) y 3 del mismo palo en la mis- 
ma mano de 5 cartas. 

Una madre que da a luz a una niña y a un par de 
gemelas el mismo día. 

Un jugador de ajedrez que pierde el último juego y 
gana el torneo. 


2.19 Suponga que una familia sale de vacaciones de 
verano en su casa rodante y que M es el evento de que 
sufrirán fallas mecánicas, T es el evento de que recibi- 
rán una infracción por cometer una falta de tránsito y V 
es el evento de que llegarán a un lugar para acampar 
que esté lleno. Remítase al diagrama de Venn de la fi- 
gura 2.5 y exprese con palabras los eventos representa- 
dos por las siguientes regiones: 


a) 
b) 
c) 
d) 
e) 
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región 5; 

región 3; 

regiones 1 y 2 juntas; 
regiones 4 y 7 juntas; 
regiones 3, 6, 7 y 8 juntas. 


2.20 Remítase al ejercicio 2.19 y al diagrama de Venn 
de la figura 2.5, liste los números de las regiones que 
representan los siguientes eventos: 


a) 


b) 


c) 


d) 


La familia no experimentará fallas mecánicas y no 
será multada por cometer una infracción de tránsi- 
to, pero llegará a un lugar para acampar que está 
lleno. 

La familia experimentará tanto fallas mecánicas 
como problemas para localizar un lugar disponible 
para acampar, pero no será multada por cometer 
una infracción de tránsito. 

La familia experimentará fallas mecánicas o en- 
contrará un lugar para acampar lleno, pero no será 
multada por cometer una infracción de tránsito. 
La familia no llegará a un lugar para acampar lleno. 


Figura 2.5: Diagrama de Venn para los ejercicios 2.19 y 2.20. 


2.3 Conteo de puntos muestrales 


Uno de los problemas que el estadístico debe considerar e intentar evaluar es el elemen- 
to de aleatoriedad asociado con la ocurrencia de ciertos eventos cuando se realiza un 
experimento. Estos problemas pertenecen al campo de la probabilidad, un tema que se 
estudiará en la sección 2.4. En muchos casos debemos ser capaces de resolver un proble- 
ma de probabilidad mediante el conteo del número de puntos en el espacio muestral, sin 
listar realmente cada elemento. El principio fundamental del conteo, a menudo denomi- 
nado regla de multiplicación, se establece en la regla 2.1. 
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.1: Si una operación se puede llevar a cabo en n, formas, y si para cada una de éstas se 

Regla 2.1: S de Il b ¿E d de ést 
puede realizar una segunda operación en n, formas, entonces las dos operaciones 
se pueden ejecutar juntas de n,n, formas. 


Ejemplo 2.13: | ¿Cuántos puntos muestrales hay en el espacio muestral cuando se lanza un раг de dados 
una vez? 

Solución: El primer dado puede caer en cualquiera de n, = 6 maneras. Para cada una de esas 6 

maneras el segundo dado también puede caer en n, = 6 formas. Por lo tanto, el par de 

dados puede caer en nn, = (6)(6) = 36 formas posibles. JJ 


Ejemplo 2.14: | Un urbanista de una nueva subdivisión ofrece a los posibles compradores de una casa 
elegir entre Tudor, rústica, colonial y tradicional el estilo de la fachada, y entre una 
planta, dos pisos y desniveles el plano de construcción. ¿En cuántas formas diferentes 
puede un comprador ordenar una de estas casas? 


Estilo de la fachada Plano de construcción 
ma 
Una sola pa 
Dos pisos 
езпге. 
y 
а 08" 
$ use 
т. Dos pisos 
Ñ Des»; 
an esnj Veles 
Со, | yanta 
ES Ohia una sola P 
9%. Dos pisos 
% D 
2, Niveles 
nia 
Una sola ра 
Dos pisos 
Desnivel 


Figura 2.6: Diagrama de árbol para el ejemplo 2.14. 


Solución: Como n, = 4 y n, = 3, un comprador debe elegir entre 
nn, = (4)(3) = 12 casas posibles. JJ 


Las respuestas a los dos ejemplos anteriores se comprueban construyendo diagra- 
mas de árbol y contando las diversas trayectorias a lo largo de las ramas. Así, en el 
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ejemplo 2.14 habrá n, = 4 ramas que corresponden a los diferentes estilos de la fachada, 
y después habrá n, = 3 ramas que se extienden de cada una de estas 4 ramas para repre- 
sentar los diferentes planos de plantas. Este diagrama de árbol, como se ilustra en la fi- 
gura 2.6, proporciona las луп, = 12 opciones de casas dadas por las trayectorias a lo 
largo de las ramas. 


Ejemplo 2.15: | Si un miembro de un club que tiene 22 integrantes necesitara elegir un presidente y un 


tesorero, ¿de cuántas maneras diferentes se podría elegir a ambos? 


Solución: Para el puesto de presidente hay 22 posibilidades en total. Para cada una de esas 22 po- 


Regla 2.2: 


sibilidades hay 21 posibilidades de elegir al tesorero. Si utilizamos la regla de la multi- 
plicación, obtenemos n, x n, = 22 x 21 = 462 maneras diferentes. J 

La regla de la multiplicación (regla 2.1) se puede extender para abarcar cualquier 
número de operaciones. Por ejemplo, suponga que un cliente desea comprar un nuevo 
teléfono celular y que puede elegir entre п, = 5 marcas, n, = 5 tipos de capacidad y 
n, = 4 colores. Estas tres clasificaciones dan como fesultado n nn, = (5)(5)(4) = 100 
diferentes formas en las que un cliente puede ordenar uno de estos teléfonos. A continua- 
ción se formula la regla de multiplicación generalizada que cubre k operaciones. 


Si una operación se puede ejecutar en n, formas, y si para cada una de éstas se puede 
llevar a cabo una segunda operación en n, formas, y para cada una de las primeras dos 
se puede realizar una tercera operación en n, formas, y así sucesivamente, entonces la 
serie de К operaciones se puede realizar en п n,...n, formas. 


Ejemplo 2.16: | Sam va a armar una computadora y para comprar las partes tiene que elegir entre las si- 


guientes opciones: dos marcas de circuitos integrados, cuatro marcas de discos duros, 
tres marcas de memorias y cinco tiendas locales en las que puede adquirir un conjunto 
de accesorios. ¿De cuántas formas diferentes puede Sam comprar las partes? 


Solución: Como n, = 2, n, = 4, n, = 3 y n, = 5, hay 


n Xn, Xn, Xn,=2x4x 3x 5= 120 


formas diferentes de comprar las partes. JJ 


Ejemplo 2.17: | ¿Cuántos números pares de cuatro dígitos se pueden formar con los dígitos 0, 1, 2, 5, 6 


y 9, si cada dígito se puede usar sólo una vez? 


Solución: Como el número debe ser par, tenemos sólo n, = 3 opciones para la posición de las uni- 


dades. Sin embargo, para un número de cuatro dígitos la posición de los millares no 
puede ser 0. Por lo tanto, consideramos la posición de las unidades en dos partes: 0 о 
diferente de 0. Si la posición de las unidades es 0 (es decir, п, = 1), tenemos n, = 5 op- 
ciones para la posición de los millares, n, = 4 para la posición de las centenas y n, = 3 
para la posición de las decenas. Por lo tanto, en este caso tenemos un total de 

n nnn, = (1)(5)(4)(3) = 60 


1234 


números pares de cuatro dígitos. Por otro lado, si la posición de las unidades по es 0 (es 
decir, n, = 2), tenemos n, = 4 opciones para la posición de los millares, n, = 4 para la 
posición de las centenas y n, = 3 para la posición de las decenas. En esta situación tene- 
mos un total de 

пп,п.п, = (2)(4)(4)(3) = 96 


1234 


números pares de cuatro dígitos. 
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Definición 2.7: 


Definición 2.8 


Teorema 2.1: 


Puesto que los dos casos anteriores son mutuamente excluyentes, el número total 

de números pares de cuatro dígitos se puede calcular usando 60 + 96 = 156. 2 

Con frecuencia nos interesamos en un espacio muestral que contiene como elemen- 

tos a todas las posibles ordenaciones o arreglos de un grupo de objetos. Por ejemplo, 

cuando queremos saber cuántos arreglos diferentes son posibles para sentar a seis perso- 

nas alrededor de una mesa, o cuando nos preguntamos cuántas ordenaciones diferentes 

son posibles para sacar dos billetes de lotería de un total de 20. En este caso los diferen- 
tes arreglos se llaman permutaciones. 


Una permutación es un arreglo de todo o parte de un conjunto de objetos. 


Considere las tres letras a, b y c. Las permutaciones posibles son abc, acb, bac, bca, 
cab y cba, por lo tanto, vemos que hay 6 arreglos distintos. Si utilizamos la regla 2.2 
podemos llegar a la respuesta 6 sin listar realmente las diferentes ordenaciones. Hay 
n, = 3 opciones para la primera posición. Sin importar cuál letra se elija, siempre ha- 
brá n, = 2 opciones para la segunda posición. Por último, independientemente de cuál 
de las dos letras se elija para las primeras dos posiciones, sólo hay n, = 1 elección para 
la última posición, lo que da un total de 

nnn, = (3)(2)(1) = 6 permutaciones 
mediante la regla 2.2. En general, n objetos distintos se pueden arreglar en 
п(п — 1)(п — 2)... (3)(2)(1) formas. 


Existe una notación para una cifra como ésta. 


Para cualquier entero no negativo n, n!, denominado “n factorial” se define como 
N! = n(n - 1)... (2)(1), 


соп el caso especial de 0! = 1. 
Si utilizamos el argumento anterior llegamos al siguiente teorema. 
El número de permutaciones de n objetos es n! 


El número de permutaciones de las cuatro letras a, b, с y d será 4! = 24. Considere- 
mos ahora el número de permutaciones que son posibles tomando dos de las cuatro letras 
a la vez. Éstas serían ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db y dc. De nuevo, si utiliza- 
mos la regla 2.1, tenemos dos posiciones para llenar con n, = 4 opciones para la prime- 
ra y después n, = 3 opciones para la segunda, para un total de 


nn, = (4)(3) = 12 


permutaciones. En general, n objetos distintos tomados de r a la vez se pueden arreglar 
en 


п(п = 1)X(n-2)...(n-r+ 1) 
formas. Representamos este producto mediante 


n! 


Pr == 
(п —г)! 
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Como resultado tenemos el teorema que sigue. 


Teorema 2.2: El número de permutaciones de n objetos distintos tomados de r a la vez es 


n! 


пР, Б 


Ејетріо 2.18: | En un año se otorgará uno de tres premios (a la investigación, la enseñanza y el servicio) 
a algunos de los estudiantes, de un grupo de 25, de posgrado del departamento de esta- 
dística. Si cada estudiante puede recibir un premio como máximo, ¿cuántas selecciones 
posibles habría? 

Solución: Como los premios son distinguibles, se trata de un problema de permutación. El número 
total de puntos muestrales es 


25! 25! 
A (ОБ дур 220 (25)(24)(23) =13,800 


Ejemplo 2.19: | En un club estudiantil compuesto por 50 personas se va a elegir a un presidente y a un 
tesorero. ¿Cuántas opciones diferentes de funcionarios son posibles si 


a) 


no hay restricciones; 


b) A participará sólo si él es el presidente; 


c) 
d) 


B y C participarán juntos o no lo harán; 


D y E no participarán juntos? 


Solución: a) El número total de opciones de funcionarios, si no hay restricciones, es 


b) 


c) 


Р› = L 50)(49) = 2450 
sP2= zg; = (50)(49) = . 


Como A participaría sólo si es el presidente, tenemos dos situaciones: 1) А se elige 
como presidente, lo cual produce 49 resultados posibles para el puesto de tesorero; o 
11) los funcionarios se eligen de entre las 49 personas restantes sin tomar en cuenta a 
A, en cuyo caso el número de opciones es „P, = (49)(48) = 2352. Por lo tanto, el 
número total de opciones es 49 + 2352 = 2401. 

El número de selecciones cuando B y C participan juntos es 2. El número de selec- 
ciones cuando ni B ni C se eligen es “Р, = 2256. Рог lo tanto, el número total de 
Opciones en esta situación es 2 + 2256 = 2258. 


d) El número de selecciones cuando D participa como funcionario pero sin E es (2)(48) 


= 96, donde 2 es el número de puestos que D puede ocupar y 48 es el número de 
selecciones de los otros funcionarios de las personas restantes en el club, excepto Е. 
El número de selecciones cuando E participa como funcionario pero sin D también 
es (2)(48) = 96. El número de selecciones cuando tanto D como E no son elegidos es 
«Ро = 2256. Por lo tanto, el número total de opciones es (2)(96) + 2256 = 2448. 
Este problema también tiene otra solución rápida: como D y E sólo pueden participar 
juntos de dos maneras, la respuesta es 2450 — 2 = 2448. 
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Teorema 2.3: 


Teorema 2.4: 


Las permutaciones que ocurren al arreglar objetos en un círculo se llaman permu- 
taciones circulares. Dos permutaciones circulares no se consideran diferentes a menos 
que los objetos correspondientes en los dos arreglos estén precedidos o seguidos por un 
objeto diferente, conforme avancemos en la dirección de las manecillas del reloj. Por 
ejemplo, si cuatro personas juegan bridge, no tenemos una permutación nueva si se mue- 
ven una posición en la dirección de las manecillas del reloj. Si consideramos a una per- 
sona en una posición fija y arreglamos a las otras tres de 3! formas, encontramos que hay 
seis arreglos distintos para el juego de bridge. 


El número de permutaciones de n objetos ordenados en un círculo es (n — 1)!. 


Hasta ahora hemos considerado permutaciones de objetos distintos. Es decir, todos 
los objetos fueron por completo diferentes o distinguibles. Evidentemente, si tanto la letra 
b como la c son iguales a x, entonces las 6 permutaciones de las letras a, b y c se convier- 
ten en axx, axx, xax, xax, xxa y xxa, de las cuales sólo 3 son diferentes. Por lo tanto, con 
3 letras, en las que 2 son iguales, tenemos 3!/2! = 3 permutaciones distintas. Con 4 letras 
diferentes a, b, с y d tenemos 24 permutaciones distintas. Si permitimos que a = b = x y 
c = d = y, podemos listar sólo las siguientes permutaciones distintas: ххуу, хуху, ухху, 
уухх, хуух у ухух. De esta forma tenemos 4!/(2!2!) = 6 permutaciones distintas. 


El número de permutaciones distintas de n objetos, en el que n, son de una clase, n, de 
una segunda clase,..., n, de una k-ésima clase es 


n! 


nina! eng! 


Ejemplo 2.20: 


Solución: 


Durante un entrenamiento de fútbol americano colegial, el coordinador defensivo nece- 
sita tener a 10 jugadores parados en una fila. Entre estos 10 jugadores hay 1 de primer 
año, 2 de segundo año, 4 de tercer año y 3 de cuarto año, respectivamente. ¿De cuántas 
formas diferentes se pueden arreglar en una fila si lo único que los distingue es el grado 
en el cual están? 

Usando directamente el teorema 2.4, el número total de arreglos es 


! 
E 600. 
11214131 Г 


Con frecuencia nos interesa el número de formas de dividir un conjunto de n objetos 
en r subconjuntos denominados celdas. Se consigue una partición si la intersección de 
todo par posible de los r subconjuntos es el conjunto vacío ф, y si la unión de todos los 
subconjuntos da el conjunto original. El orden de los elementos dentro de una celda no 
tiene importancia. Considere el conjunto (a, e, i, o, u}. Las particiones posibles en dos 
celdas en las que la primera celda contenga 4 elementos y la segunda 1 son 


{(a, e, i, о), (и)), {(a, i, o, u), (e)}, (е, i, o, u), (a)), {(а, e, o, и), (0), {(a, e, i, u), (0)). 


Vemos que hay 5 formas de partir un conjunto de 4 elementos en dos subconjuntos o 
celdas que contengan 4 elementos en la primera celda y 1 en la segunda. 
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El número de particiones para esta ilustración se denota con la expresión 


5 5! 
=” 


en la que el número superior representa el número total de elementos y los números in- 
feriores representan el número de elementos que van en cada celda. Establecemos esto 
de forma más general en el teorema 2.5. 


Teorema 2.5: El número de formas de partir un conjunto de n objetos en r celdas con n, elementos en 
la primera celda, n, elementos en la segunda, y así sucesivamente, es 


( n ) n! 
= > 
Ai суз се. 105 ОИ 


donde л, + л, +... + п, = п. 


Ejemplo 2.21: | Un hotel va a hospedar a siete estudiantes de posgrado que asisten a una conferencia, ¿en 
cuántas formas los puede asignar a una habitación triple y a dos dobles? 
Solución: El número total de particiones posibles sería 


7 ) 7! 
= = =210. 
Ao 312121 3 


En muchos problemas nos interesamos en el número de formas de seleccionar r 
objetos de n sin importar el orden. Tales selecciones se llaman combinaciones. Una 
combinación es realmente una partición con dos celdas, donde una celda contiene los r 
objetos seleccionados y la otra contiene los (n — r) objetos restantes. El número de tales 
combinaciones se denota con 


( á ) que por lo general se reduce a @ R 
Е 


МП г 


debido a que el número de elementos en la segunda celda debe ser n – r. 


Teorema 2.6: El número de combinaciones de n objetos distintos tomados de r a la vez es 


AN n! 


Ejemplo 2.22: | Un niño le pide a su madre que le lleve cinco cartuchos de Game-Boy™ de su colección 
de 10 juegos recreativos y 5 de deportes. ¿De cuántas maneras podría su madre llevarle 
3 juegos recreativos y 2 de deportes? 
Solución: El número de formas de seleccionar 3 cartuchos de 10 es 


! 
10 _ 10! — 120. 
3 3!(10—3)! 


El número de formas de seleccionar 2 cartuchos de 5 es 


5 5! 
=== = 1 
(5) 2131719 
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Si utilizamos la regla de la multiplicación (regla 2.1) con n, = 120 y n, = 10, tenemos 


que hay (120)(10) = 1200 formas. 


Ml 


Ejemplo 2.23: | ¿Cuántos arreglos diferentes de letras se pueden hacer con las letras de la palabra 


STATISTICS? 


Solución: Si utilizamos el mismo argumento expuesto en el teorema 2.6, en este ejemplo podemos 
realmente aplicar el teorema 2.5 para obtener 


10 
3,3,2, 1,1 


10! 
) =aaa A 


Aquí tenemos 10 letras en total, donde 2 letras (S, Т) aparecen tres veces cada una, la 
letra Г aparece dos veces, y las letras A y C aparecen una vez cada una. Por otro lado, el 
resultado se puede obtener directamente usando el teorema 2.4. JJ 


Ejercicios 


2.21 A los participantes de una convención se les 
ofrecen seis recorridos, cada uno de tres días, a sitios de 
interés. ¿De cuántas maneras se puede acomodar una 
persona para que vaya a uno de los recorridos planea- 
dos por la convención? 


2.22 En un estudio médico los pacientes se clasifican 
en 8 formas de acuerdo con su tipo sanguíneo: AB*, 
AB", A*, A”, B+, В", О* u О; y también de acuerdo con 
su presión sanguínea: baja, normal o alta. Encuentre el 
número de formas en las que se puede clasificar a un 
paciente. 


2.23 Si un experimento consiste en lanzar un dado y 
después extraer una letra al azar del alfabeto inglés, 
¿cuántos puntos habrá en el espacio muestral? 


2.24 Los estudiantes de humanidades de una univer- 
sidad privada se clasifican como estudiantes de primer 
año, de segundo año, de penúltimo año o de último año, 
y también de acuerdo con su género (hombres o muje- 
res). Calcule el número total de clasificaciones posibles 
para los estudiantes de esa universidad. 


2.25 Cierta marca de calzado existe en 5 diferentes 
estilos y cada estilo está disponible en 4 colores distin- 
tos. Si la tienda deseara mostrar la cantidad de pares de 
zapatos que incluya todos los diversos estilos y colores, 
¿cuántos pares diferentes tendría que mostrar? 


2.26 Un estudio en California concluyó que siguien- 
do siete sencillas reglas para la salud un hombre y una 
mujer pueden prolongar su vida 11 y 7 años en prome- 
dio, respectivamente. Estas 7 reglas son: no fumar, ha- 
cer ejercicio de manera habitual, moderar su consumo 
de alcohol, dormir siete u ocho horas, mantener el peso 
adecuado, desayunar y no ingerir alimentos entre comi- 


das. De cuántas formas puede una persona adoptar cin- 
co de estas reglas: 
а) ¿Si la persona actualmente infringe las siete reglas? 
b) ¿Si la persona nunca bebe y siempre desayuna? 


2.27 Un urbanista de un nuevo fraccionamiento ofre- 
ce a un posible comprador de una casa elegir entre 4 
diseños, 3 diferentes sistemas de calefacción, un garaje 
o cobertizo, y un patio o un porche cubierto. ¿De cuán- 
tos planos diferentes dispone el comprador? 


2.28 Un medicamento para aliviar el asma se puede 
adquirir en 5 diferentes laboratorios y en forma de lí- 
quido, comprimidos o cápsulas, todas en concentración 
normal o alta. ¿De cuántas formas diferentes puede un 
médico recetar la medicina a un paciente que sufre de 
asma? 


2.29 En un estudio económico de combustibles, cada 
uno de 3 autos de carreras se prueba con 5 marcas dife- 
rentes de gasolina en 7 lugares de prueba que se locali- 
zan en diferentes regiones del país. Si en el estudio se 
utilizan 2 pilotos y las pruebas se realizan una vez en 
cada uno de los distintos grupos de condiciones, ¿cuán- 
tas pruebas se necesita realizar? 


2.30 ¿De cuántas formas distintas se puede respon- 
der una prueba de falso-verdadero que consta de 9 pre- 
guntas? 


2.31 Un testigo de un accidente automovilístico le 
dijo a la policía que la matrícula del culpable, que huyó, 
contenía las letras RLH seguidas por 3 dígitos, de los 
cuales el primero era un 5. Si el testigo no recuerda 
los 2 últimos dígitos, pero está seguro de que los 3 eran 
distintos, calcule la cantidad máxima de registros de 
automóviles que la policía tendría que revisar. 
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2.32 a) ¿De cuántas maneras se pueden formar 6 per- 
sonas para abordar un autobús? 

b) ¿Cuántas maneras son posibles si, de las 6, 3 per- 
sonas específicas insisten en formarse una después 
de la otra? 

c) ¿De cuántas maneras se pueden formar si, de las 6, 
2 personas específicas se rehúsan a formarse una 
detrás de la otra? 


2.33 Si una prueba de opción múltiple consta de 5 
preguntas, cada una con 4 respuestas posibles, de las 
cuales sólo 1 es correcta, 
a) ¿de cuántas formas diferentes puede un estudiante 
elegir una respuesta a cada pregunta? 
b) ¿de cuántas maneras puede un estudiante elegir 
una respuesta a cada pregunta y obtener todas las 
respuestas incorrectas? 


2.34 a) ¿Cuántas permutaciones distintas se pueden 
hacer con las letras de la palabra COLUMNA? 
b) ¿Cuántas de estas permutaciones comienzan con 
la letra M? 


2.35 Un contratista desea construir 9 casas, cada una 
con diferente diseño. ¿De cuántas formas puede ubicar- 
las en la calle en la que las va a construir si en un lado 
de ésta hay 6 lotes y en el lado opuesto hay 3? 


2.36 а) ¿Cuántos números de tres dígitos se pueden 
formar con los dígitos 0, 1, 2, 3, 4, 5 y 6 si cada 
dígito se puede usar sólo una vez? 

b) ¿Cuántos de estos números son impares? 
c) ¿Cuántos son mayores que 330? 


2.37 ¿De cuántas maneras se pueden sentar 4 niños y 
5 niñas en una fila, si se deben alternar unos y otras? 


2.38 Cuatro parejas compran 8 lugares en la misma 
fila para un concierto. ¿De cuántas maneras diferentes 
se pueden sentar... 
a) sin restricciones? 
b) si cada pareja se sienta junta? 
c) si todos los hombres se sientan juntos a la derecha 
de todas las mujeres? 
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2.39 En un concurso regional de ortografía, los 8 fi- 
nalistas son 3 niños y 5 niñas. Encuentre el número de 
puntos muestrales en el espacio muestral 5 рага el nú- 
mero de ordenamientos posibles al final del concurso 
para 

а) los 8 finalistas; 

b) los 3 primeros lugares. 


2.40 ¿De cuántas formas se pueden cubrir las 5 posi- 
ciones iniciales en un equipo de baloncesto con 8 juga- 
dores que pueden jugar cualquiera de las posiciones? 


2.41 Encuentre el número de formas en que se puede 
asignar 6 profesores a 4 secciones de un curso intro- 
ductorio de psicología, si ningún profesor se asigna a 
más de una sección. 


2.42 De un grupo de 40 boletos se sacan 3 billetes de 
lotería para el primero, segundo y tercer premios. En- 
cuentre el número de puntos muestrales еп 5 para dar 
los 3 premios, si cada concursante sólo tiene un billete. 


2.43 ¿De cuántas maneras se pueden plantar 5 árbo- 
les diferentes en un círculo? 


2.44 ¿De cuántas formas se puede acomodar en 
círculo una caravana de ocho carretas de Arizona? 


2.45 ¿Cuántas permutaciones distintas se pueden ha- 
cer con las letras de la palabra INFINITO? 


2.46 ¿De cuántas maneras se pueden colocar 3 ro- 
bles, 4 pinos y 2 arces a lo largo de la línea divisoria de 
una propiedad, si no se distingue entre árboles del mis- 
mo tipo? 


2.47 ¿De cuántas formas se puede seleccionar a 3 de 
8 candidatos recién graduados, igualmente calificados, 
para ocupar las vacantes de un despacho de contabi- 
lidad? 


2.48 ¿Cuántas formas hay en que dos estudiantes no 
tengan la misma fecha de cumpleaños en un grupo de 
60? 


Quizá fue la insaciable sed del ser humano por el juego lo que condujo al desarrollo tem- 
prano de la teoría de la probabilidad. En un esfuerzo por aumentar sus triunfos, algunos 
pidieron a los matemáticos que les proporcionaran las estrategias óptimas para los diversos 
juegos de azar. Algunos de los matemáticos que brindaron tales estrategias fueron Pascal, 
Leibniz, Fermat y James Bernoulli. Como resultado de este desarrollo inicial de la teoría 
de la probabilidad, la inferencia estadística, con todas sus predicciones y generalizaciones, 
ha rebasado el ámbito de los juegos de azar para abarcar muchos otros campos asociados 
con los eventos aleatorios, como la política, los negocios, el pronóstico del clima y la 
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investigación científica. Para que estas predicciones y generalizaciones sean razonable- 
mente precisas, resulta esencial la comprensión de la teoría básica de la probabilidad. 

¿A qué nos referimos cuando hacemos afirmaciones como “Juan probablemente 
ganará el torneo de tenis”, o “tengo 50% de probabilidades de obtener un número par 
cuando lanzo un dado”, o “la universidad no tiene posibilidades de ganar el juego de 
fútbol esta noche”, o “la mayoría de nuestros graduados probablemente estarán casados 
dentro de tres años”? En cada caso expresamos un resultado del cual no estamos seguros, 
pero con base en la experiencia, o a partir de la comprensión de la estructura del experi- 
mento, confiamos hasta cierto punto en la validez de nuestra afirmación. 

En el resto de este capítulo consideraremos sólo aquellos experimentos para los cua- 
les el espacio muestral contiene un número finito de elementos. La probabilidad de la 
ocurrencia de un evento que resulta de tal experimento estadístico se evalúa utilizando un 
conjunto de números reales denominados pesos o probabilidades, que van de O a 1. Para 
todo punto en el espacio muestral asignamos una probabilidad tal que la suma de todas 
las probabilidades es 1. Si tenemos razón para creer que al llevar a cabo el experimento 
es bastante probable que ocurra cierto punto muestral, le tendríamos que asignar a éste 
una probabilidad cercana a 1. Por el contrario, si creemos que no hay probabilidades de 
que ocurra cierto punto muestral, le tendríamos que asignar a éste una probabilidad cer- 
cana a cero. En muchos experimentos, como lanzar una moneda o un dado, todos los 
puntos muestrales tienen la misma oportunidad de ocurrencia, por lo tanto, se les asignan 
probabilidades iguales. A los puntos fuera del espacio muestral, es decir, a los eventos 
simples que no tienen posibilidades de ocurrir, les asignamos una probabilidad de cero. 

Para encontrar la probabilidad de un evento A sumamos todas las probabilidades 
que se asignan a los puntos muestrales en A. Esta suma se denomina probabilidad de A 
y se denota con P(A). 


Definición 2.9: La probabilidad de un evento A es la suma de los pesos de todos los puntos muestrales 
en A. Por lo tanto, 


(02 (20) = Р(ф) = 0 y ROSI 
Además, si A,, A,, A,,... es una serie de eventos mutuamente excluyentes, entonces 


Р(А UA, UA, U...) = Р(А,) + Р(А,) + Р(А,) +... 


Ejemplo 2.24 | Una moneda se lanza dos veces. ¿Cuál es la probabilidad de que ocurra al menos una 
cara (H)? 
Solución: El espacio muestral para este experimento es 


S = (4H, HT, TH, TT) 


Si la moneda está balanceada, cada uno de estos resultados tendrá las mismas probabili- 
dades de ocurrir. Por lo tanto, asignamos una probabilidad de wa cada uno de los puntos 
muestrales. Entonces, 4w = 1 o w = 1/4. Si A representa el evento de que ocurra al 
menos una cara (H), entonces 


1 
A =(HH,HT,TH) y P(A) = тег Г 


Ejemplo 2.25: | Se carga un dado de forma que exista el doble de probabilidades de que salga un número 
par que uno impar. Si E es el evento de que ocurra un número menor que 4 en un solo 
lanzamiento del dado, calcule P(E). 


54 


Solución: 
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El espacio muestral es 5 = {1, 2, 3, 4, 5, 6). Asignamos una probabilidad de w a cada 
número impar y una probabilidad de 2w a cada número par. Como la suma de las proba- 
bilidades debe ser 1, tenemos 9w = 1 o w = 1/9. Por lo tanto, asignamos probabilidades 
de 1/9 y 2/9 a cada número impar y par, respectivamente. Por consiguiente, 


1 2 1 4 
Е =41,2,3 Р(Е = —-+--+-=-. 
{ y PŒ) Ыы ыа: J 


Ejemplo 2.26: | En el ejemplo 2.25, sea A el evento de que resulte un número par y sea B el evento de que 


Solución: 


Regla 2.3: 


resulte un número divisible entre 3. Calcule P(A U B) y P(A N B). 
Рага los eventos A = {2,4,6} y В = {3, 6), tenemos 


AUB=(2,3,4,6)yANB= (6). 

Al asignar una probabilidad de 1/9 a cada número impar y de 2/9 a cada número par, 
tenemos 
2 
9 2 

Si el espacio muestral рага un experimento contiene № elementos, todos los cuales 
tienen las mismas probabilidades de ocurrir, asignamos una probabilidad igual а 1/N a 
cada uno de los N puntos. La probabilidad de que cualquier evento A contenga n de estos 


N puntos muestrales es entonces el cociente del número de elementos en A y el número 
de elementos en S. 


3 1.2 2 7 
PAUE)= + +57 у РИПВ) е 


Si un experimento puede dar como resultado cualquiera de N diferentes resultados que 
tienen las mismas probabilidades de ocurrir, y si exactamente n de estos resultados 
corresponden al evento A, entonces la probabilidad del evento A es 


Р(А) = — 


Ejemplo 2.27: | A una clase de estadística para ingenieros asisten 25 estudiantes de ingeniería industrial, 


Solución: 


10 de ingeniería mecánica, 10 de ingeniería eléctrica y 8 de ingeniería civil. Si el profe- 
sor elige al azar a un estudiante para que conteste una pregunta, ¿qué probabilidades hay 
de que el elegido sea a) estudiante de ingeniería industrial, b) estudiante de ingeniería 
civil o estudiante de ingeniería eléctrica?. 

Las especialidades de los estudiantes de ingeniería industrial, mecánica, eléctrica y civil 
se denotan con /, M, E у C, respectivamente. El grupo está integrado рог 53 estudiantes 
y todos tienen las mismas probabilidades de ser seleccionados. 


a) Como 25 de los 53 individuos estudian ingeniería industrial, la probabilidad del 
evento Г, es decir, la de elegir al azar a alguien que estudia ingeniería industrial, es 
25 
Р(Т)у= =. 
De 3 
b) Como 18 de los 53 estudiantes son de las especialidades de ingeniería civil o eléctri- 
ca, se deduce que 
18 
P(CUE)= >=. 
53 И | 


2.4 Probabilidad de un evento 55 


Ejemplo 2.28: | En una mano de póquer que consta de 5 cartas encuentre la probabilidad de tener 2 ases 
y 3 jotas. 
Solución: El número de formas de tener 2 ases de 4 cartas es 


4 4! 
(5) алш 


y el número de formas de tener 3 jotas de 4 cartas es 


4\ _ 4! ne 
3) 3111 


Mediante la regla de multiplicación (regla 2.1), obtenemos n = (6)(4) = 24 manos соп 
2 ases y 3 jotas. El número total de manos de póquer de 5 cartas, todas las cuales tienen 
las mismas probabilidades de ocurrir, es 


52 52! 
N= a = т = 2,598,960. 


Рог lo tanto, la probabilidad del evento С de obtener 2 ases y 3 jotas en una mano de 
póquer de 5 cartas es 24 
=0.9 x 107°. 


Р(С) = =— 
2,598,960 3 


Si los resultados de un experimento no tienen las mismas probabilidades de ocurrir, 
las probabilidades se deben asignar con base en el conocimiento previo o en la evidencia 
experimental. Por ejemplo, si una moneda no está balanceada, podemos estimar las pro- 
babilidades de caras y cruces lanzándola muchas veces y registrando los resultados. De 
acuerdo con la definición de frecuencia relativa de la probabilidad, las probabilidades 
verdaderas serían las fracciones de caras y cruces que ocurren a largo plazo. Otra forma 
intuitiva de comprender la probabilidad es el método de la indiferencia. Por ejemplo, si 
usted tiene un dado que cree que está balanceado, el método con el que podría determi- 
nar que hay 1/6 de probabilidades de que resulte cada una de las seis caras después de 
lanzarlo una vez es el método de la indiferencia. 

Para encontrar un valor numérico que represente de forma adecuada la probabilidad 
de ganar en el tenis, dependemos de nuestro desempeño previo en el juego, así como 
también del de nuestro oponente y, hasta cierto punto, de la capacidad de ganar que 
creemos tener. De manera similar, para calcular la probabilidad de que un caballo gane 
una carrera, debemos llegar a una probabilidad basada en las marcas anteriores de todos 
los caballos que participan en la carrera, así como de las marcas de los jinetes que los 
montan. La intuición, sin duda, también participa en la determinación del monto que 
estemos dispuestos a apostar. El uso de la intuición, las creencias personales y otra infor- 
mación indirecta para llegar a probabilidades se conoce como la definición subjetiva de 
la probabilidad. 

En la mayoría de las aplicaciones de probabilidad de este libro la que opera es la 
interpretación de frecuencia relativa de probabilidad, la cual se basa en el experimento 
estadístico en vez de en la subjetividad y es considerada, más bien, como frecuencia 
relativa limitante. Como resultado, muchas aplicaciones de probabilidad en ciencia e 
ingeniería se deben basar en experimentos que se puedan repetir. Cuando asignamos 
probabilidades que se basan en información y opiniones previas, como en la afirmación: 
“hay grandes probabilidades de que los Gigantes pierdan el Súper Tazón”, se encuentran 
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conceptos menos objetivos de probabilidad. Cuando las opiniones y la información pre- 
via difieren de un individuo a otro, la probabilidad subjetiva se vuelve el recurso perti- 
nente. En la estadística bayesiana (véase el capítulo 18) se usará una interpretación más 
subjetiva de la probabilidad, la cual se basará en obtener información previa de probabi- 
lidad. 


2.5 Reglas aditivas 


Teorema 2.7: 


Prueba: 


Corolario 2.1: 


A menudo resulta más sencillo calcular la probabilidad de algún evento a partir de las 
probabilidades conocidas de otros eventos. Esto puede ser cierto si el evento en cuestión 
se puede representar como la unión de otros dos eventos o como el complemento de al- 
gún evento. А continuación se presentan varias leyes importantes que con frecuencia 
simplifican el cálculo de las probabilidades. La primera, que se denomina regla aditiva, 
se aplica a uniones de eventos. 


Si A y В son dos eventos, entonces 


P(A U B) = P(A) + Р(В) – P(A N В). 


A ANB B 


Figura 2.7: Regla aditiva de probabilidad. 


Considere el diagrama de Venn de la figura 2.7. P(AUB) es la suma de las probabilida- 
des de los puntos muestrales en (A U B). Así, P(A) + P(B) es la suma de todas las pro- 
babilidades en A más la suma de todas las probabilidades en B. Por lo tanto, sumamos 
dos veces las probabilidades en (A N B). Como estas probabilidades se suman a P(A N 
B), debemos restar esta probabilidad una vez para obtener la suma de las probabilidades 
enA UB. JJ 


Si A y В son mutuamente excluyentes, entonces 
P(A U B) = P(A) + P(B). 
El corolario 2.1 es un resultado inmediato del teorema 2.7, pues si A y B son mutua- 


mente excluyentes, А N B = 0 y entonces P(A N B) = Р(ф) = 0. En general, podemos 
anotar el corolario 2.2. 
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Corolario 2.2: SiA,,A,,..., A, son mutuamente excluyentes, entonces 


P(A, UA, U = UA) = P(A,) + Р(А) + = + P(A,). 


Un conjunto de eventos (А, 4,,... А, } de un espacio muestral $ se denomina parti- 
ción de 5 si Ap A,,..., A, son mutuamente excluyentes y A, UA, U -- UA, = S. Por lo 
tanto, tenemos 


Corolario 2.3: SiA,,A,,..., A, es una partición de un espacio muestral 5, entonces 


Р(А UA, U = UA) = P(A) + P(A) + + P(A) = Р($) = 1. 


Como se esperaría, el teorema 2.7 se extiende de forma análoga. 


Teorema 2.8: Para tres eventos A, B y C, 


P(A U BU C) = P(A) + P(B) + P(C) 
FRAMAR RAMO BBC) EAEN): 


Ejemplo 2.29: | Al final del semestre John se va a graduar en la facultad de ingeniería industrial de una 
universidad. Después de tener entrevistas en dos empresas en donde quiere trabajar, de- 
termina que la probabilidad que tiene de lograr una oferta de empleo en la empresa A es 
0.8, y que la probabilidad de obtenerla en la empresa B es 0.6. Si, por otro lado, conside- 
ra que la probabilidad de recibir ofertas de ambas empresas es 0.5, ¿qué probabilidad 
tiene de obtener al menos una oferta de esas dos empresas? 

Solución: Si usamos la regla aditiva tenemos 


P(A U B) = P(A) + P(B) – P(A N В) = 0.8 + 0.6 – 0.5 = 0.9. J 


Ejemplo 2.30: | ¿Cuál es la probabilidad de obtener un total de 7 u 11 cuando se lanza un par de dados? 
Solución: Sea A el evento de que resulte 7 y B el evento de que salga 11. Ahora bien, para 6 de los 
36 puntos muestrales ocurre un total de 7 y sólo para 2 de ellos ocurre un total de 11. 
Como todos los puntos muestrales tienen la misma probabilidad, tenemos P(A) = 1/6 y 
P(B) = 1/18. Los eventos A y B son mutuamente excluyentes, ya que un total de 7 y uno 
de 11 no pueden ocurrir en el mismo lanzamiento. Por lo tanto, 


Р(А ОВ) =Р(А) +Р(В) = 5 +35 =; 


Este resultado también se podría obtener contando el número total de puntos para el 
evento A U B, es decir, 8 y escribir 
8 


n 2 
Р(А ОВ) = — = — = =. 
Р) N 36 9 
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El teorema 2.7 y sus tres corolarios deberían ayudar al lector a comprender mejor la 
probabilidad y su interpretación. Los corolarios 2.1 y 2.2 sugieren el resultado muy in- 
tuitivo tratando con la probabilidad de que ocurra al menos uno de varios eventos, sin 
que puedan ocurrir dos de ellos simultáneamente. La probabilidad de que al menos ocu- 
rra uno es la suma de las probabilidades de ocurrencia de los eventos individuales. El 
tercer corolario simplemente establece que el valor mayor de una probabilidad (unidad) 
se asigna a todo el espacio muestral S. 


Ejemplo 2.31: | Las probabilidades de que un individuo que compra un automóvil nuevo elija uno de 


Solución: 


Teorema 2.9: 


Prueba: 


color verde, uno blanco, uno rojo o uno azul son 0.09, 0.15, 0.21 y 0.23, respectivamen- 
te, ¿cuál es la probabilidad de que un comprador dado adquiera un automóvil nuevo que 
tenga uno de esos colores? 

Sean V, B, R y A los eventos de que un comprador seleccione, respectivamente, un auto- 
móvil verde, blanco, rojo o azul. Como estos cuatro eventos son mutuamente excluyen- 
tes, la probabilidad es 


PVUBURUA)=P(V) + P(B) + P(R) + P(A) 
= 0.09 + 0.15 + 0.21 + 0.23 = 0.68. J 


A menudo es más difícil calcular la probabilidad de que ocurra un evento que calcu- 
lar la probabilidad de que el evento no ocurra. Si éste es el caso para algún evento A, 


simplemente calculamos primero Р(А”) y, después, mediante el teorema 2.7, calculamos 
P(A) por sustracción. 


51 А y A” son eventos complementarios, entonces 
P(A) + Р(А”) = 1 
Como A U А” = S, y los conjuntos A y A” son disjuntos, entonces 


1 = P(S) = P(A U A’ = P(A) + P(A’) J 


Ejemplo 2.32: | Si las probabilidades de que un mecánico automotriz dé servicio a 3, 4, 5, 6, 7, 8 о más 


Solución: 


vehículos en un día de trabajo dado son 0.12, 0.19, 0.28, 0.24, 0.10 y 0.07, respectiva- 
mente, ¿cuál es la probabilidad de que dé servicio al menos a 5 vehículos el siguiente día 
de trabajo? 

Sea E el evento de que al menos 5 automóviles reciban servicio. Ahora bien, P(E) = 1 
— P(E’), donde F’ es el evento de que menos de 5 automóviles reciban servicio. Como 


Р(Е) = 0.12 + 0.19 = 0.31. 


del teorema 2.9 se deduce que 


P(E) = 1 -0.31 = 0.69. J 


Ejemplo 2.33: | Suponga que las especificaciones del fabricante para la longitud del cable de cierto tipo 


de computadora son 2000 + 10 milímetros. En esta industria se sabe que el cable peque- 
ño tiene la misma probabilidad de salir defectuoso (de no cumplir con las especificacio- 
nes) que el cable grande. Es decir, la probabilidad de que aleatoriamente se produzca un 
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cable con una longitud mayor que 2010 milímetros es igual a la probabilidad de pro- 
ducirlo con una longitud menor que 1990 milímetros. Se sabe que la probabilidad de que 
el procedimiento de producción cumpla con las especificaciones es 0.99. 


a) ¿Cuál es la probabilidad de que un cable elegido al azar sea muy largo? 


b) ¿Cuál es la probabilidad de que un cable elegido al azar sea más grande que 1990 


milímetros? 


Solución: Sea E el evento de que un cable cumpla con las especificaciones. Sean P y G los eventos 
de que el cable sea muy pequeño o muy grande, respectivamente. Entonces, 


a) P(E) = 0.99 y P(P) = P(G) = (1 – 0.99)/2 = 0.005. 


b) Si la longitud de un cable seleccionado al azar se denota con X, tenemos 


P(1990 < X < 2010) = P(E) = 0.99. 
Сото Р(Х > 2010) = P(G) = 0.005, 


P(X > 1990) = P(E) + P(G) = 0.995 


Esto también se resuelve utilizando el teorema 2.9: 


Р(Х > 1990) + Р(Х < 1990) = 1. 
Así, Р(Х > 1990) = 1 – P(P) = 1 – 0.005 = 0.995. J 


Ejercicios 


2.49 Encuentre los errores en cada una de las siguien- 
tes aseveraciones: 


a) Las probabilidades de que un vendedor de auto- 
móviles venda 0, 1,2 o 3 unidades en un día dado 
de febrero son 0.19, 0.38, 0.29 y 0.15, respectiva- 
mente. 


b) La probabilidad de que llueva mañana es 0.40 y la 
probabilidad de que no llueva es 0.52. 


c) Las probabilidades de que una impresora cometa 
0, 1, 2, 3 о 4 о más errores al imprimir un docu- 
mento son 0.19, 0.34, —0.25, 0.43 y 0.29, respec- 
tivamente. 


d) Al sacar una carta de una baraja en un solo inten- 
to la probabilidad de seleccionar un corazón es 
1/4, la probabilidad de seleccionar una carta negra 
es 1/2, y la probabilidad de seleccionar una car- 
ta de corazones y negra es 1/8. 


2.50 Suponga que todos los elementos de $ en el ejer- 
cicio 2.8 de la página 42 tienen la misma probabilidad 
de ocurrencia y calcule 

a) la probabilidad del evento A; 

b) la probabilidad del evento C; 

с) la probabilidad del evento A N С. 


2.51 Una caja contiene 500 sobres, de los cuales 
75 contienen $100 en efectivo, 150 contienen $25 y 
275 contienen $10. Se puede comprar un sobre en $25. 
¿Cuál es el espacio muestral para las diferentes canti- 
dades de dinero? Asigne probabilidades a los puntos 
muestrales y después calcule la probabilidad de que el 
primer sobre que se compre contenga menos de $100. 


2.52 Suponga que se descubre que, en un grupo de 
500 estudiantes universitarios de último año, 210 fu- 
man, 258 consumen bebidas alcohólicas, 216 comen 
entre comidas, 122 fuman y consumen bebidas alcohó- 
licas, 83 comen entre comidas y consumen bebidas al- 
cohólicas, 97 fuman y comen entre comidas y 52 tienen 
esos tres hábitos nocivos para la salud. Si se selecciona 
al azar a un miembro de este grupo, calcule la probabi- 
lidad de que el estudiante 


a) fume pero no consuma bebidas alcohólicas; 
b) coma entre comidas y consuma bebidas alcohóli- 
cas pero no fume; 
с) no fume пі coma entre comidas. 
2.53 La probabilidad de que una industria estadouni- 


dense se ubique en Shanghái, China, es 0.7, la probabi- 
lidad de que se ubique en Beijing, China, es 0.4 y la 
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probabilidad de que se ubique en Shamghái o Beijing, 
o en ambas ciudades, es 0.8. ¿Cuál es la probabilidad 
de que la industria se ubique... 

a) en ambas ciudades? 

b) en ninguna de esas ciudades? 


2.54 Basado en su experiencia, un agente bursátil 
considera que en las condiciones económicas actuales 
la probabilidad de que un cliente invierta en bonos li- 
bres de impuestos es 0.6, la de que invierta en fondos 
comunes de inversión es 0.3 y la de que invierta en am- 
bos es 0.15. En esta ocasión encuentre la probabilidad 
de que un cliente invierta 

a) en bonos libres de impuestos o en fondos comunes 

de inversión; 

b) en ninguno de esos dos instrumentos. 
2.55 Si cada artículo codificado en un catálogo empie- 
za con 3 letras distintas seguidas por 4 dígitos distintos 
de cero, calcule la probabilidad de seleccionar aleatoria- 
mente uno de estos artículos codificados que tenga 
como primera letra una vocal y el último dígito sea par. 


2.56 Un fabricante de automóviles está preocupado 
por el posible retiro de su sedán de cuatro puertas con 
mayor venta. Si fuera retirado habría 0.25 de probabili- 
dad de que haya un defecto en el sistema de frenos, 0.18 
de que haya un defecto en la transmisión, 0.17 de que 
esté en el sistema de combustible y 0.40 de que esté en 
alguna otra área. 

a) ¿Cuál es la probabilidad de que el defecto esté en 
los frenos o en el sistema de combustible, si la pro- 
babilidad de que haya defectos en ambos sistemas 
de manera simultánea es 0.15? 

b) ¿Cuál es la probabilidad de que no haya defecto en 
los frenos o en el sistema de combustible? 


2.57 Si se elige al azar una letra del alfabeto inglés, 
encuentre la probabilidad de que la letra 

a) sea una vocal excepto y; 

b) esté listada en algún lugar antes de la letra j; 

c) esté listada en algún lugar después de la letra g. 


2.58 Se lanza un par de dados. Calcule la probabili- 
dad de obtener 

a) un total de 8; 

b) máximo un total de 5. 


2.59 Еп una mano de póquer que consta de 5 cartas, 
encuentre la probabilidad de tener 

а) 3 ases; 

b) 4 cartas de corazones y 1 de tréboles. 


2.60 Si se toman 3 libros al azar, de un librero que 
contiene 5 novelas, 3 libros de poemas y 1 diccionario, 
¿cuál es la probabilidad de que... 

a) se seleccione el diccionario? 

b) se seleccionen 2 novelas y 1 libro de poemas? 
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2.61 En un grupo de 100 estudiantes graduados de 
preparatoria, 54 estudiaron matemáticas, 69 estudiaron 
historia y 33 cursaron matemáticas e historia. Si se se- 
lecciona al azar uno de estos estudiantes, calcule la pro- 
babilidad de que 
a) el estudiante haya cursado matemáticas o historia; 
b) el estudiante no haya llevado ninguna de estas ma- 
terias; 
c) el estudiante haya cursado historia pero no mate- 
máticas. 


2.62 La empresa Dom's Pizza utiliza pruebas de sa- 
bor y el análisis estadístico de los datos antes de comer- 
cializar cualquier producto nuevo. Considere un estudio 
que incluye tres tipos de pastas (delgada, delgada con 
ajo y orégano, y delgada con trozos de queso). Dom's 
también está estudiando tres salsas (estándar, una nue- 
va salsa con más ajo y una nueva salsa con albahaca 
fresca). 
a) ¿Cuántas combinaciones de pasta y salsa se inclu- 
yen? 
b) ¿Cuál es la probabilidad de que un juez reciba una 
pasta delgada sencilla con salsa estándar en su pri- 
mera prueba de sabor? 


2.63 A continuación se listan los porcentajes, propor- 
cionados por Consumer Digest (julio/agosto de 1996), 
de las probables ubicaciones de las PC en una casa: 


Dormitorio de adultos: 0.03 
Dormitorio de niños: 0.15 
Otro dormitorio: 0.14 
Oficina o estudio: 0.40 
Otra habitación: 0.28 


a) ¿Cuál es la probabilidad de que una PC esté en un 
dormitorio? 

b) ¿Cuál es la probabilidad de que no esté en un dor- 
mitorio? 

с) Suponga que de entre las casas que tienen una PC 
se selecciona una al azar, ¿en qué habitación espe- 
raría encontrar una PC? 


2.64 Existe interés por la vida de un componente 
electrónico. Suponga que se sabe que la probabilidad 
de que el componente funcione más de 6000 horas es 
0.42. Suponga, además, que la probabilidad de que el 
componente no dure más de 4000 horas es 0.04. 
a) ¿Cuál es la probabilidad de que la vida del compo- 
nente sea menor o igual a 6000 horas? 
b) ¿Cuál es la probabilidad de que la vida del compo- 
nente sea mayor que 4000 horas? 


2.65 Considere la situación del ejercicio 2.64. Sea А 
el evento de que el componente falle en una prueba es- 
pecífica y B el evento de que se deforme pero no falle. 
El evento A ocurre con una probabilidad de 0.20 y el 
evento B ocurre con una probabilidad de 0.35. 


Ejercicios 


a) ¿Cuál es la probabilidad de que el componente no 
falle en la prueba? 

b) ¿Cuál es la probabilidad de que el componente 
funcione perfectamente bien (es decir, que ni se 
deforme ni falle en la prueba)? 

с) ¿Cuál es la probabilidad de que el componente fa- 
lle o se deforme en la prueba? 


2.66 А los obreros de las fábricas se les motiva cons- 
tantemente a practicar la tolerancia cero para prevenir 
accidentes en el lugar de trabajo. Los accidentes pue- 
den ocurrir porque el ambiente o las condiciones labo- 
rales son inseguros. Por otro lado, los accidentes 
pueden ocurrir por negligencia o fallas humanas. Ade- 
más, los horarios de trabajo de 7:00 А.м. a 3:00 P.M. 
(turno matutino), de 3:00 р.м. a 11:00 р.м. (turno ves- 
pertino) y de 11:00 р.м. a 7:00 A.M. (turno nocturno) 
podría ser un factor. El año pasado ocurrieron 300 ac- 
cidentes. Los porcentajes de los accidentes por la com- 
binación de condiciones son los que siguen: 


Condiciones Fallas 
Turno inseguras humanas 
Matutino 5% 32% 
Vespertino 6% 25% 
Nocturno 2% 30% 


Si se elige aleatoriamente un reporte de accidente de 
entre los 300 reportes, 
a) ¿Cuál es la probabilidad de que el accidente haya 
ocurrido en el turno nocturno? 
b) ¿Cuál es la probabilidad de que el accidente haya 
ocurrido debido a una falla humana? 
с) ¿Cuál es la probabilidad de que el accidente haya 
ocurrido debido a las condiciones inseguras? 
d) ¿Cuál es la probabilidad de que el accidente haya 
ocurrido durante los turnos vespertino o nocturno? 


2.67 Considere la situación del ejemplo 2.32 de la pá- 
gina 58. 
a) ¿Cuál es la probabilidad de que el número de auto- 
móviles que recibirán servicio del mecánico no 
sea mayor de 4? 
b) ¿Cuál es la probabilidad de que el mecánico dé 
servicio a menos de 8 automóviles? 
c) ¿Cuál es la probabilidad de que el mecánico dé 
servicio a 3 о 4 automóviles? 


2.68 Existe interés por el tipo de horno, eléctrico о de 
gas, que se compra en una tienda departamental especí- 
fica. Considere la decisión que al respecto toman seis 
clientes distintos. 

a) Suponga que hay 0.40 de probabilidades de que 
como máximo dos de esos clientes compren un 
horno eléctrico. ¿Cuál será la probabilidad de que 
al menos tres compren un horno eléctrico? 


61 


b) Suponga que se sabe que la probabilidad de que 
los seis compren el horno eléctrico es 0.007, mien- 
tras que la probabilidad de que los seis compren el 
horno de gas es 0.104. ¿Cuál es la probabilidad de 
vender, por lo menos, un horno de cada tipo? 


2.69 En muchas áreas industriales es común que se uti- 
licen máquinas para llenar las cajas de productos. Esto 
ocurre tanto en la industria de comestibles como en otras 
que fabrican productos de uso doméstico, como los de- 
tergentes. Dichas máquinas no son perfectas y, de hecho, 
podrían cumplir las especificaciones de llenado de las 
cajas (A), llenarlas por debajo del nivel especificado (B) 
o rebasar el límite de llenado (C). Por lo general, lo que 
se busca evitar es la práctica del llenado insuficiente. Sea 
P(B) = 0.001, mientras que Р(А) = 0.990. 
a) Determine P(C). 
b) ¿Cuál es la probabilidad de que la máquina no lle- 
ne de manera suficiente? 
c) ¿Cuál es la probabilidad de que la máquina llene 
de más o de menos? 


2.70 Considere la situación del ejercicio 2.69. Supon- 
ga que se producen 50,000 cajas de detergente por se- 
mana, y que los clientes “devuelven” las cajas que no 
están suficientemente llenas y solicitan que se les reem- 
bolse lo que pagaron por ellas. Suponga que se sabe 
que el “costo” de producción de cada caja es de $4.00 y 
que se venden a $4.50. 
a) ¿Cuál es la utilidad semanal cuando no hay devo- 
luciones de cajas defectuosas? 
b) ¿Cuál es la pérdida en utilidades esperada debido 
a la devolución de cajas insuficientemente lle- 
nadas? 


2.71 Como podría sugerir la situación del ejercicio 
2.69, a menudo los procedimientos estadísticos se utili- 
zan para control de calidad (es decir, control de calidad 
industrial). A veces el peso de un producto es una varia- 
ble importante que hay que controlar. Se dan especifi- 
caciones de peso para ciertos productos empacados, y 
si un paquete no las cumple (está muy ligero o muy 
pesado) se rechaza. Los datos históricos sugieren que 
la probabilidad de que un producto empacado cumpla 
con las especificaciones de peso es 0.95; mientras que 
la probabilidad de que sea demasiado ligero es 0.002. 
El fabricante invierte $20.00 en la producción de cada 
uno de los productos empacados y el consumidor los 
adquiere a un precio de $25.00. 

a) ¿Cuál es la probabilidad de que un paquete elegido 
al azar de la línea de producción sea demasia- 
do pesado? 

b) Si todos los paquetes cumplen con las especifica- 
ciones de peso, ¿qué utilidad recibirá el fabricante 
por cada 10,000 paquetes que venda? 
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c) Suponga que todos los paquetes defectuosos fue- 2.72 Demuestre que 


ron rechazados y perdieron todo su valor, ¿a cuán- 

to se reduciría la utilidad de la venta de 10,000 P(A’ A B^ = 1 + P(A A В) – P(A) – P(B). 
paquetes debido a que no se cumplieron las espe- 

cificaciones de peso? 


2.6 Probabilidad condicional, independencia y regla del producto 


Un concepto muy importante en la teoría de probabilidad es la probabilidad condicional. 
En algunas aplicaciones el profesional se interesa por la estructura de probabilidad bajo 
ciertas restricciones. Por ejemplo, en epidemiología, en lugar de estudiar las probabili- 
dades de que una persona de la población general tenga diabetes, podría ser más intere- 
sante conocer esta probabilidad en un grupo distinto, como el de las mujeres asiáticas 
cuya edad está en el rango de 35 a 50 años, o como el de los hombres hispanos cuya edad 
está entre los 40 y los 60 años. A este tipo de probabilidad se le conoce como probabili- 
dad condicional. 


Probabilidad condicional 


La probabilidad de que ocurra un evento B cuando se sabe que ya ocurrió algún evento 
A se llama probabilidad condicional y se denota con P(B|A). El símbolo P(B|A) por lo 
general se lee como “la probabilidad de que ocurra B, dado que ocurrió A”, o simplemen- 
te, “la probabilidad de B, dado A”. 

Considere el evento B de obtener un cuadrado perfecto cuando se lanza un dado. El 
dado se construye de modo que los números pares tengan el doble de probabilidad de 
ocurrencia que los números nones. Con base en el espacio muestral 5 = {1, 2, 3, 4, 5, 6), 
en el que a los números impares y a los pares se les asignaron probabilidades de 1/9 y 
2/9, respectivamente, la probabilidad de que ocurra B es de 1/3. Suponga ahora que se 
sabe que el lanzamiento del dado tiene como resultado un número mayor que 3. Tene- 
mos ahora un espacio muestral reducido, А = (4, 5, 6}, que es un subconjunto de 5. Para 
encontrar la probabilidad de que ocurra B, en relación con el espacio muestral A, debe- 
mos comenzar por asignar nuevas probabilidades a los elementos de A, que sean propor- 
cionales a sus probabilidades originales de modo que su suma sea 1. Al asignar una 
probabilidad de w al número non en А y una probabilidad de 2w a los dos números pares, 
tenemos 5w = 1 o w = 1/5. En relación con el espacio A, encontramos que B contiene 
sólo el elemento 4. Si denotamos este evento con el símbolo B|A, escribimos 
ВІА = {4} y, en consecuencia, 


2 
Р(В|А) = =. 


Este ejemplo ilustra que los eventos pueden tener probabilidades diferentes cuando se 
consideran en relación con diferentes espacios muestrales. 
También podemos escribir 
2 29 P(ANB) 
PEAS g= вт P(A) ” 

donde P(A N B) y P(A) se calculan a partir del espacio muestral original S. En otras pa- 
labras, una probabilidad condicional relativa a un subespacio A de S se puede calcular en 
forma directa de las probabilidades que se asignan a los elementos del espacio muestral 
original $. 
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Definición 2.10: La probabilidad condicional de B, dado A, que se denota con P(B|A), se define como 


P(A NB) 


Р(В|А) = , 
P(A) > siempre que P(A) > 0. 

Un ejemplo más: suponga que tenemos un espacio muestral 5 constituido por la 
población de adultos de una pequeña ciudad que cumplen con los requisitos para obtener 
un título universitario. Debemos clasificarlos de acuerdo con su género y situación labo- 
ral. Los datos se presentan en la tabla 2.1. 


Tabla 2.1: Clasificación de los adultos de una pequeña ciudad 


Empleado  — Desempleado Total 


Hombre 460 40 500 
Mujer 140 260 400 
Total 600 300 900 


Se seleccionará al azar a uno de estos individuos para que realice un viaje a través 
del país con el fin de promover las ventajas de establecer industrias nuevas en la ciudad. 
Nos interesaremos en los eventos siguientes: 


М: se elige a un hombre, 
E: el elegido tiene empleo. 


Al utilizar el espacio muestral reducido E, encontramos que 


PM |E) = 460 23 
600 30 
Sea n(A) el número de elementos en cualquier conjunto A. Podemos utilizar esta 
notación, puesto que cada uno de los adultos tiene las mismas probabilidades de ser 
elegido, para escribir 


pins E жЕ, ВЕ 
MIE AS) РЕ) ' 


en donde P(E N М) y P(E) se calculan a partir del espacio muestral original <. Para ve- 
rificar este resultado observe que 


600 2 460 23 
Р(Е)= —=2 у P(ENM)=— = =. 
“MS? РОМЕ зл. 

Рог 1о їапїо, 

23/45 23 
РОВ 213 — 30 


como antes. 


Ejemplo 2.34: [Та probabilidad de que un vuelo programado normalmente salga а tiempo es P(D) = 
0.83, la probabilidad de que llegue a tiempo es P(A) = 0.82 y la probabilidad de que 


64 


Solución: 
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salga y llegue a tiempo es P(D N A) = 0.78. Calcule la probabilidad de que un avión 
a) llegue a tiempo, dado que salió a tiempo; y b) salió a tiempo, dado que llegó a tiempo. 
Al utilizar la definición 2.10 tenemos lo que sigue: 


a) La probabilidad de que un avión llegue a tiempo, dado que salió a tiempo es 


P(DNA) _ 0.78 


PADIS P(D) 0.83 


= 0.94. 


b) La probabilidad de que un avión haya salido a tiempo, dado que llegó a tiempo es 


P(DNA) 0.78 _ 
P(A) 0.82 qn: JJ 


Р(Р|А) = 


La noción de probabilidad condicional brinda la capacidad de reevaluar la idea de 
probabilidad de un evento a la luz de la información adicional; es decir, cuando se sabe 
que ocurrió otro evento. La probabilidad Р(А|В) es una actualización de P(A) basada en 
el conocimiento de que ocurrió el evento B. En el ejemplo 2.34 es importante conocer la 
probabilidad de que el vuelo llegue a tiempo. Tenemos la información de que el vuelo no 
salió a tiempo. Con esta información adicional, la probabilidad más pertinente es 
P(A|D”), esto es, la probabilidad de que llegue a tiempo, dado que no salió a tiempo. A 
menudo las conclusiones que se obtienen a partir de observar la probabilidad condicio- 
nal más importante cambian drásticamente la situación. En este ejemplo, el cálculo de 
P(A|D') es 


P(A ND’) _ 0.82 – 0.78 


ds bi POD) 017 


= 0.24. 


Como resultado, la probabilidad de una llegada a tiempo disminuye significativamente 
ante la presencia de la información adicional. 


Ejemplo 2.35: |El concepto de probabilidad condicional tiene innumerables aplicaciones industriales y 


Solución: 


biomédicas. Considere un proceso industrial en el ramo textil, en el que se producen 
listones de una tela específica. Los listones pueden resultar con defectos en dos de sus 
características: la longitud y la textura. En el segundo caso el proceso de identificación 
es muy complicado. A partir de información histórica del proceso se sabe que 10% de 
los listones no pasan la prueba de longitud, que 5% no pasan la prueba de textura y que 
sólo 0.8% no pasan ninguna de las dos pruebas. Si en el proceso se elige un listón al azar 
y una medición rápida identifica que no pasa la prueba de longitud, ¿cuál es la probabi- 
lidad de que la textura esté defectuosa? 

Considere los eventos 


L: defecto en longitud, T: defecto en textura. 


Dado que el listón tiene una longitud defectuosa, la probabilidad de que este listón 
tenga una textura defectuosa está dada por 


P(T AL) _ 0.008 


PUEIS РО) 01 


= 0.08. 
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Eventos independientes 


En el experimento del lanzamiento de un dado de la página 62 señalamos que Р(В|А) = 
2/5, mientras que P(B) = 1/3. Es decir, Р(В|А) + P(B), lo cual indica que В depende de 
A. Consideremos ahora un experimento en el que se sacan 2 cartas, una después de la 
otra, de una baraja ordinaria, con reemplazo. Los eventos se definen como 


A: la primera carta es un as, 
B: la segunda carta es una espada. 


Como la primera carta se reemplaza, nuestro espacio muestral para la primera y segunda 
cartas consta de 52 cartas, que contienen 4 ases y 13 espadas. Entonces, 


13 1 1⁄3 4 
P(B|A) = — = – P(B) = — = —. 
(е тд + "BIE е5 


Es decir, P(B|A) = P(B). Cuando esto es cierto, se dice que los eventos A у В son inde- 
pendientes. 

Aunque la probabilidad condicional permite alterar la probabilidad de un evento a 
la luz de material adicional, también nos permite entender mejor el muy importante 
concepto de independencia o, en el contexto actual, de eventos independientes. En el 
ejemplo 2.34 del aeropuerto, P(A]D) difiere de P(A). Esto sugiere que la ocurrencia de D 
influye en A y esto es lo que, de hecho, se espera en este caso. Sin embargo, considere la 
situación en donde tenemos los eventos A y B, y 


Р(А|В) = P(A). 


En otras palabras, la ocurrencia de В no influye en las probabilidades de ocurrencia de 
A. Aquí la ocurrencia de A es independiente de la ocurrencia de B. No podemos dejar 
de resaltar la importancia del concepto de independencia, ya que desempeña un papel 
vital en el material de casi todos los capítulos de este libro y en todas las áreas de la 
estadística aplicada. 


Definición 2.11: Dos eventos A y B son independientes si y sólo si 
Р(В|А) = P(B) o Р(А|В) = P(A), 


si se asume la existencia de probabilidad condicional. De otra forma, A y B son depen- 
dientes. 


La condición P(B|A) = P(B) implica que P(A|B) = P(A), y viceversa. Para los 
experimentos de extracción de una carta, donde mostramos que Р(В|А) = P(B) = 1/4, 
también podemos ver que Р(А|В) = Р(А) = 1/13. 


La regla de producto o regla multiplicativa 


Al multiplicar la fórmula de la definición 2.10 por P(A), obtenemos la siguiente regla 
multiplicativa importante (o regla de producto), que nos permite calcular la probabili- 
dad de que ocurran dos eventos. 
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Teorema 2.10: 
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Si en un experimento pueden ocurrir los eventos A y B, entonces 


P(A N В) = Р(А)Р(В|А), siempre que P(A) > 0. 


Por consiguiente, la probabilidad de que ocurran A y B es igual a la probabilidad de que 
ocurra A multiplicada por la probabilidad condicional de que ocurra B, dado que ocurre A. 
Como los eventos A N В y B ПА son equivalentes, del teorema 2.10 se deduce que también 
podemos escribir 


P(A N B) = P(B N A) = P(B)P(A|B). 


En otras palabras, no importa qué evento se considere como A ni qué evento se conside- 
re como B. 


Ejemplo 2.36: | Suponga que tenemos una caja de fusibles que contiene 20 unidades, de las cuales 5 es- 


Solución: 


tán defectuosas. Si se seleccionan 2 fusibles al azar y se retiran de la caja, uno después 
del otro, sin reemplazar el primero, ¿cuál es la probabilidad de que ambos fusibles estén 
defectuosos? 

Sean A el evento de que el primer fusible esté defectuoso y B el evento de que el segun- 
do esté defectuoso; entonces, interpretamos A N В como el evento de que ocurra А, y 
entonces B ocurre después de que haya ocurrido A. La probabilidad de sacar primero un 
fusible defectuoso es 1/4; entonces, la probabilidad de separar un segundo fusible defec- 
tuoso de los restantes 4 es 4/19. Por lo tanto, 


1 4 1 
ра пв)= (3) (5) = ту: F 


Ejemplo 2.37: | Una bolsa contiene 4 bolas blancas y 3 negras, y una segunda bolsa contiene 3 blancas y 


Solución: 


5 negras. Se saca una bola de la primera bolsa y se coloca sin verla en la segunda bolsa. 
¿Cuál es la probabilidad de que ahora se saque una bola negra de la segunda bolsa? 

№ N, у В, representan, respectivamente, la extracción de una bola negra de la bolsa 1, 
una bola negra de la bolsa 2 y una bola blanca de la bolsa 1. Nos interesa la unión de los 
eventos mutuamente excluyentes N, N N, y В, N N, Las diversas posibilidades y sus 


probabilidades se ilustran en la figura 2.8. "Entonces 


РІМ ПМ) о( B¡NN2)]=P(N¡NN2>)+P(B¡NN)) 
= Р(М)Р(№ |М) + P(B 1)P (M2|B 1) 


2 6 J 4 SN _ 38 
7 9 7 9 63 J 
Si, en el ejemplo 2.36, el primer fusible se reemplaza y los fusibles se reacomodan 
por completo antes de extraer el segundo, entonces la probabilidad de que se extraiga un 
fusible defectuoso en la segunda selección sigue siendo 1/4; es decir, Р(В|А) = P(B), y 


los eventos A y B son independientes. Cuando esto es cierto podemos sustituir P(B) por 
Р(В|А) en el teorema 2.10 para obtener la siguiente regla multiplicativa especial. 
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Teorema 2.11: 


РМ N Мә) = (3/7)(6/9) 


N 
6/9 
Bolsa 2 
М ЗВ, 6N B 
3/9 P(N1 N B2) = (3/7)(3/9) 
Bolsa 1 3/7 
4B, 3N 4/7 
N P(B1 п Мә) = (4/7)(5/9) 
В Bolsa 2 6/9 
4B, 5N 
4/9 
B 


Р(Ві п Вә) = (4/7)(4/9) 


Figura 2.8: Diagrama de árbol рага el ejemplo 2.37. 


Dos eventos A y В son independientes 51 y sólo 51 
P(A П В) = Р(А)Р(В). 


Por lo tanto, para obtener la probabilidad de que ocurran dos eventos independientes 
simplemente calculamos el producto de sus probabilidades individuales. 


Ejemplo 2.38: | Una pequeña ciudad dispone de un carro de bomberos y una ambulancia para emergen- 


Solución: 


cias. La probabilidad de que el carro de bomberos esté disponible cuando se necesite es 
0.98 y la probabilidad de que la ambulancia esté disponible cuando se le requiera es 0.92. 
En el evento de un herido en un incendio, calcule la probabilidad de que tanto la ambu- 
lancia como el carro de bomberos estén disponibles, suponiendo que operan de forma 
independiente. 

Sean A y B los respectivos eventos de que estén disponibles el carro de bomberos y la 
ambulancia. Entonces, 


P(A N В) = Р(А)Р(В) = (0.98)(0.92) = 0.9016. И | 


Ejemplo 2.39: | Un sistema eléctrico consta de cuatro componentes, como se ilustra en la figura 2.9. El 


Solución: 


sistema funciona si los componentes A y B funcionan, y si funciona cualquiera de los 
componentes C o D. La confiabilidad (probabilidad de que funcionen) de cada uno de 
los componentes también se muestra en la figura 2.9. Calcule la probabilidad de a) que 
el sistema completo funcione y de b) que el componente C no funcione, dado que el 
sistema completo funciona. Suponga que los cuatro componentes funcionan de manera 
independiente. 

En esta configuración del sistema, A, B y el subsistema C y D constituyen un sistema 
de circuitos en serie; mientras que el subsistema C y D es un sistema de circuitos en 
paralelo. 
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a) Es evidente que la probabilidad de que el sistema completo funcione se puede calcu- 
lar de la siguiente manera: 
PANBN(CUD)]= Р(А)Р(В)Р(С U D) = Р(А)Р(В)[1— P(C A Р”)] 
= Р(А)Р(В)[1 – Р(СЭР(Р?) 
= (0.9)(0.9)[1—(1— 0.8)(1 – 0.8)] = 0.7776. 
Las igualdades anteriores son válidas debido а la independencia entre los cuatro 
componentes. 
b) Para calcular la probabilidad condicional en este caso, observe que 


р = Р (el sistema funciona pero С no funciona) 
P (el sistema funciona) 


P(ANBNC'ND) _ (0.910.911 — 0.8)(0.8) 


= = 0.1667. 
P (el sistema funciona) 0.7776 
0.8 
с 
0.9 0.9 
А B 
0.8 


D 


Figura 2.9: Un sistema eléctrico para el ejemplo 2.39. 


La regla multiplicativa se puede extender a situaciones con más de dos eventos. 


Teorema 2.12: Si, en un experimento, pueden ocurrir los eventos А,А,,.., А„ entonces 
EMS А) 
= P(A )Р(А ЛА JP(AJA, NA) P(A A, NA,N NA, .). 
Si los eventos А, A,,..., A, son independientes, entonces 
P(A, NA, П--ПА,) = P(A )Р(А,)--Р(А,) 


Ejemplo 2.40: | Se sacan tres cartas seguidas, sin reemplazo, de una baraja ordinaria. Encuentre la pro- 
babilidad de que ocurra el evento A, ПА, NA, donde A, es el evento de que la primera 
carta sea un as rojo, A, el evento de que la segunda carta sea un 10 o una jota y A, el 
evento de que la tercera carta sea mayor que 3 pero menor que 7. 

Solución: Primero definimos los eventos: 


А: la primera carta es un as rojo, 
A,: la segunda carta es un 10 o una jota, 


Ejercicios 
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A; la tercera carta es mayor que 3 pero menor que 7. 


Ahora bien, 


2 8 
P(A1)= zzy PAM) = сү P(A3[41N4>2) = 


12 
50” 


por lo tanto, por medio del teorema 2.12, 


Р(А ПА ПАз) = P (A1)P (A2|A1)P (A3|A1 ПА») 


7 (9 (sr) (5) = a ү 


La propiedad de independencia establecida en el teorema 2.11 se puede extender а 
situaciones con más de dos eventos. Considere, por ejemplo, el caso de los tres eventos A, 
В y С. No basta con tener P(A N B N С) = P(A)P(B)P(C) como una definición de inde- 
pendencia entre los tres. Suponga que A = В y С = 0, el conjunto vacío. Aunque A N B 
N С = f, que da como resultado P(A N B N С) = 0 = Р(А)Р(В)Р(С), los eventos A y В 
no son independientes. En consecuencia, tenemos la siguiente definición: 


Definición 2.12: Un conjunto de eventos A = (A,,..., А} son mutuamente independientes si para cual- 
quier subconjunto de A, А.-А para k < п, tenemos 


P(A, N-NA,) = Р(А, )--Р(А,). 


Ejercicios 


2.73 Si R es el evento de que un convicto cometa un 
robo a mano armada y D es el evento de que el convic- 
to venda drogas, exprese en palabras lo que en probabi- 
lidades se indica como 

a) P(R|D); 

b) P(D'|R); 

с) P(R'D”). 


2.74 Un grupo de estudiantes de física avanzada se 
compone de 10 alumnos de primer año, 30 del último 
año y 10 graduados. Las calificaciones finales muestran 
que 3 estudiantes de primer año, 10 del último año y 5 
de los graduados obtuvieron 10 en el curso. Si se elige 
un estudiante al azar de este grupo y se descubre que es 
uno de los que obtuvieron 10 de calificación, ¿cuál es la 
probabilidad de que sea un estudiante de último año? 


2.75 La siguiente es una clasificación, según el géne- 
ro y el nivel de escolaridad, de una muestra aleatoria de 
200 adultos. 

Escolaridad Hombre Mujer 


Primaria 38 45 
Secundaria 28 50 
Universidad 22 17 


Si se elige una persona al azar de este grupo, ¿cuál es la 
probabilidad de que... 


a) la persona sea hombre, dado que su escolaridad es 
de secundaria?; 

b) la persona no tenga un grado universitario, dado 
que es mujer? 


2.76 Еп un experimento para estudiar la relación que 
existe entre el hábito de fumar y la hipertensión arterial 
se reúnen los siguientes datos para 180 individuos: 


Fumadores Fumadores 
No fumadores moderados empedernidos 
H 21 36 30 
SH 48 26 19 


donde las letras Н y SH de la tabla representan Hiper- 
tensión y Sin hipertensión, respectivamente. Si se se- 
lecciona uno de estos individuos al azar, calcule la 
probabilidad de que la persona... 
a) sufra hipertensión, dado que es una fumadora em- 
pedernida; 
b) no fume, dado que no padece hipertensión. 


2.77 En un grupo de 100 estudiantes de bachillerato 
que están cursando el último año, 42 cursaron matemá- 
ticas, 68 psicología, 54 historia, 22 matemáticas e his- 
toria, 25 matemáticas y psicología, 7 historia pero ni 
matemáticas ni psicología, 10 las tres materias y 8 no 
cursaron ninguna de las tres. Seleccione al azar a un 
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estudiante de este grupo y calcule la probabilidad de 
los siguientes eventos: 
a) Una persona inscrita en psicología y cursa las tres 
materias; 
b) Una persona que no está inscrita en psicología y 
esté cursando historia y matemáticas. 


2.78 Un fabricante de una vacuna рага la gripe está 
interesado en determinar la calidad de su suero. Con 
ese fin tres departamentos diferentes procesan los lotes 
de suero y tienen tasas de rechazo de 0.10, 0.08 y 0.12, 
respectivamente. Las inspecciones de los tres departa- 
mentos son secuenciales e independientes. 

a) ¿Cuál es la probabilidad de que un lote de suero 
sobreviva a la primera inspección departamental 
pero sea rechazado por el segundo departamento? 

b) ¿Cuál es la probabilidad de que un lote de suero 
sea rechazado por el tercer departamento? 


2.79 Еп USA Today (5 de septiembre de 1996) se lis- 
taron los siguientes resultados de una encuesta sobre el 
uso de ropa para dormir mientras se viaja: 


Hombre Mujer Total 
Ropa interior 0.020 0.024 0.244 
Camisón 0.002 0.180 0.182 
Nada 0.160 0.018 0.178 
Pijama 0.102 0.073 0.175 
Camiseta 0.046 0.088 0.134 
Otros 0.084 0.003 0.087 


a) ¿Cuál es la probabilidad de que un viajero sea una 
mujer que duerme desnuda? 

b) ¿Cuál es la probabilidad de que un viajero sea 
hombre? 

c) Si el viajero fuera hombre, ¿cuál sería la probabi- 
lidad de que duerma con pijama? 

d) ¿Cuál es la probabilidad de que un viajero sea 
hombre si duerme con pijama o con camiseta? 


2.80 La probabilidad de que cuando se tenga que Пе- 
nar el tanque de gasolina de un automóvil también se 
necesite cambiarle el aceite es 0.25, la probabilidad 
de que también se le tenga que cambiar el filtro de acei- 
te es 0.40, y la probabilidad de que se necesite cambiar- 
le el aceite y el filtro es 0.14. 

a) Si se le tiene que cambiar el aceite, ¿cuál es la pro- 
babilidad de que también se necesite cambiarle el 
filtro? 

b) Si se le tiene que cambiar el filtro de aceite, ¿cuál 
es la probabilidad de que también se le tenga que 
cambiar el aceite? 


2.81 La probabilidad de que un hombre casado vea 
cierto programa de televisión es 0.4 y la probabi- 
lidad de que lo vea una mujer casada es 0.5. La proba- 
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bilidad de que un hombre vea el programa, dado que su 
esposa lo ve, es 0.7. Calcule la probabilidad de que 
a) una pareja casada vea el programa; 
b) una esposa vea el programa dado que su esposo lo 
ve; 
с) al menos uno de los miembros de la pareja casada 
vea el programa. 


2.82 Para parejas casadas que viven en cierto subur- 
bio, la probabilidad de que el esposo vote en un refe- 
réndum es 0.21, la probabilidad de que vote la esposa 
es 0.28 y la probabilidad de que ambos voten es 0.15. 
¿Cuál es la probabilidad de que... 

a) al menos uno de los miembros de la pareja casada 

vote? 
b) una esposa vote, dado que su esposo vota? 
c) un esposo vote, dado que su esposa no vota? 


2.83 La probabilidad de que un vehículo que entra a 
las Cavernas Luray tenga matrícula de Canadá es 0.12, 
la probabilidad de que sea una casa rodante es 0.28 y la 
probabilidad de que sea una casa rodante con matrícula 
de Canadá es 0.09. ¿Cuál es la probabilidad de que... 
a) una casa rodante que entra a las Cavernas Luray 
tenga matrícula de Canadá? 
b) un vehículo con matrícula de Canadá que entra a 
las Cavernas Luray sea una casa rodante? 
c) un vehículo que entra a las Cavernas Luray no 
tenga matrícula de Canadá o no sea una casa ro- 
dante? 


2.84 La probabilidad de que el jefe de familia esté en 
casa cuando llame el representante de marketing de una 
empresa es 0.4. Dado que el jefe de familia está en 
casa, la probabilidad de que la empresa le venda un 
producto es 0.3. Encuentre la probabilidad de que el 
jefe de familia esté en casa y compre productos de la 
empresa. 


2.85 La probabilidad de que un doctor diagnostique 
de manera correcta una enfermedad específica es 0.7. 
Dado que el doctor hace un diagnóstico incorrecto, la 
probabilidad de que el paciente entable una demanda 
legal es 0.9. ¿Cuál es la probabilidad de que el doctor 
haga un diagnóstico incorrecto y el paciente lo de- 
mande? 


2.86 En 1970, 11% de los estadounidenses completa- 
ron cuatro años de universidad; de ese porcentaje 43 % 
eran mujeres. En 1990, 22% de los estadounidenses 
completaron cuatro años de universidad, un porcentaje 
del cual 53 % fueron mujeres. (Time, 19 de enero de 
1996). 
a) Dado que una persona completó cuatro años de uni- 
versidad en 1970, ¿cuál es la probabilidad de que 
esa persona sea mujer? 
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b) ¿Cuál es la probabilidad de que una mujer haya 
terminado cuatro años de universidad en 1990? 

с) ¿Cuál es la probabilidad de que en 1990 un hom- 
bre no haya terminado la universidad? 


2.87 Un agente de bienes raíces tiene 8 llaves maes- 
tras para abrir varias casas nuevas. Sólo 1 llave maestra 
abrirá cualquiera de las casas. Si 40% de estas casas 
por lo general se dejan abiertas, ¿cuál es la probabili- 
dad de que el agente de bienes raíces pueda entrar en 
una casa específica, si selecciona 3 llaves maestras al 
azar antes de salir de la oficina? 


2.88 Antes de la distribución de cierto software esta- 
dístico se prueba la precisión de cada cuarto disco com- 
pacto (CD). El proceso de prueba consiste en correr 
cuatro programas independientes y verificar los resul- 
tados. La tasa de falla para los 4 programas de prueba 
son 0.01, 0.03, 0.02 y 0.01, respectivamente. 
a) ¿Cuál es la probabilidad de que uno de los CD que 
se pruebe no pase la prueba? 
b) Dado que se prueba un CD, ¿cuál es la probabili- 
dad de que falle el programa 2 o 3? 
с) En una muestra de 100, ¿cuántos CD esperaría que 
se rechazaran? 
d) Dado que un CD está defectuoso, ¿cuál es la pro- 
babilidad de que se pruebe? 


2.89 Una ciudad tiene dos carros de bomberos que 
Operan de forma independiente. La probabilidad de que 
un carro específico esté disponible cuando se le necesi- 
te es 0.96. 
a) ¿Cuál es la probabilidad de que ninguno esté dis- 
ponible cuando se necesite? 
b) ¿Cuál es la probabilidad de que un carro de bom- 
beros esté disponible cuando se le necesite? 


2.90 La contaminación de los ríos de Estados Unidos 
ha sido un problema por muchos años. Considere los 
siguientes eventos: 


0.7 
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el río está contaminado. 


B: al probar una muestra de agua se detecta contami- 
nación. 


C: se permite pescar. 


Suponga que P(A) = 0.3, Р(В|А) = 0.75, Р(В|А”) = 
0.20, Р(С|А A В) = 0.20, P(C|A'N В) = 0.15, P(C|A 
N В”) = 0.80 y P(C|A'N В”) = 0.90. 
a) Calcule P(A N BN С). 
b) Calcule P(B'N С). 
c) Calcule P(C). 
d) Calcule la probabilidad de que el río esté contami- 
nado, dado que está permitido pescar y que la 
muestra probada no detectó contaminación. 


2.91 Encuentre la posibilidad de seleccionar aleato- 
riamente 4 litros de leche en buenas condiciones suce- 
sivamente de un refrigerador que contiene 20 litros, de 
los cuales 5 están echados a perder, utilizando 
a) la primera fórmula del teorema 2.12 de la página 
68; 
b) las fórmulas del teorema 2.6 y la regla 2.3 de las 
páginas 50 y 54, respectivamente. 


2.92 Imagine el diagrama de un sistema eléctrico 
como el que se muestra en la figura 2.10. ¿Cuál es la 
probabilidad de que el sistema funcione? Suponga que 
los componentes fallan de forma independiente. 


2.93 En la figura 2.11 se muestra un sistema de cir- 
cuitos. Suponga que los componentes fallan de manera 
independiente. 
a) ¿Cuál es la probabilidad de que el sistema comple- 
to funcione? 
b) Dado que el sistema funciona, ¿cuál es la probabi- 
lidad de que el componente A no funcione? 


2.94 En la situación del ejercicio 2.93 se sabe que 
el sistema no funciona. ¿Cuál es la probabilidad de 
que el componente A tampoco funcione? 


0.7 0.7 


0.8 


с 


Figura 2.10: Diagrama рага el ejercicio 2.92. 


0.8 0.8 0.8 


C D E 


Figura 2.11: Diagrama para el ejercicio 2.93. 
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2.7 Regla de Bayes 


La estadística bayesiana es un conjunto de herramientas que se utiliza en un tipo especial 
de inferencia estadística que se aplica en el análisis de datos experimentales en mu- 
chas situaciones prácticas de ciencia e ingeniería. La regla de Bayes es una de las normas 
más importantes de la teoría de probabilidad, ya que es el fundamento de la inferencia 
bayesiana, la cual se analizará en el capítulo 18. 


Probabilidad total 


Regresemos al ejemplo de la sección 2.6, en el que se selecciona un individuo al azar de 
entre los adultos de una pequeña ciudad para que viaje por el país promoviendo las ven- 
tajas de establecer industrias nuevas en la ciudad. Suponga que ahora se nos da la infor- 
mación adicional de que 36 de los empleados y 12 de los desempleados son miembros 
del Club Rotario. Deseamos encontrar la probabilidad del evento A de que el individuo 
seleccionado sea miembro del Club Rotario. Podemos remitirnos a la figura 2.12 y escri- 
bir A como la unión de los dos eventos mutuamente excluyentes E N A y E’ N A. Por lo 
tanto, А = (E N A) U (Е ПА), y mediante el corolario 2.1 del teorema 2.7 y luego me- 
diante el teorema 2.10, podemos escribir 


P(A) = Р (EN А) U (E N А)] = P(E N А) + Р(Е' N А) 
= Р(Е)Р(А|Е) + P(E)P(A|E). 


E' 


Figura 2.12: Diagrama de Venn para los eventos A, E y E”. 


Los datos de la sección 2.6, junto con los datos adicionales antes dados para el conjunto 
A, nos permiten calcular 


600 2 36 3 
РО ор + PUBIS = шу 


1 12 1 


Si mostramos estas probabilidades mediante el diagrama de árbol de la figura 2.13, don- 
de la primera rama da la probabilidad P(E)P(A|E) y la segunda rama da la probabilidad 
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E  PMJE)=3/50 А 


> P(E)P(AJE) 
Ф 
Y 
< 
&% 
X 
2. 
©? 
P(ENP(AJE”) 


Е P(A|EY = 1/25 A 


Figura 2.13: Diagrama de árbol para los datos de la página 63 con información adicional 
de la página 72. 


la probabilidad Р(Е”)Р(А|Е”), deducimos que 


ro (5) () + G) (в) = 


Una generalización del ejemplo anterior para el caso en donde el espacio muestral 
se parte en k subconjuntos se cubre mediante el siguiente teorema, que algunas veces se 
denomina teorema de probabilidad total o regla de eliminación. 


Teorema 2.13: Si los eventos В, B,,... B, constituyen una partición del espacio muestral S, tal que 
P(B) + 0 para i = 1, 2,..., k, entonces, para cualquier evento A de S, 


k k 
P(A)= У P(B; ПА) = ) P(B:)P (A|B;). 


i=1 i=1 


Figura 2.14: Partición del espacio muestral s. 
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Prueba: Considere el diagrama de Venn de la figura 2.14. Se observa que el evento A es la unión 
de los eventos mutuamente excluyentes 


B NA, В, ПА,..., В, ПА; 
es decir, 


A = (B ПА) О (B, ПА) U- U (B,N A) 
Por medio del corolario 2.2 del teorema 2.7 y el teorema 2.10 obtenemos 


P(A)= РВ; ПА) О(Вз ПА) О = U(Bk ПА)] 
= P(B; ПА) + Р(Вх ПА) + ·-· +Р(В ПА) 


k 
= Y P(B¡NA) 


i=1 


К 
= Y P(Bi)P(A|B;). 
¡=1 JJ 


Ejemplo 2.41: | Tres máquinas de cierta planta de ensamble, B, B, y B,, montan 30%, 45% y 25% de los 
productos, respectivamente. Se sabe por experiencia que 2%, 3% y 2% de los produc- 
tos ensamblados por cada máquina, respectivamente, tienen defectos. Ahora bien, supon- 
ga que se selecciona de forma aleatoria un producto terminado. ¿Cuál es la probabilidad 
de que esté defectuoso? 

Solución: Considere los siguientes eventos: 


A: el producto está defectuoso, 

В: el producto fue ensamblado con la máquina В, 
B,: el producto fue ensamblado con la máquina В,, 
By: el producto fue ensamblado con la máquina В,. 


Podemos aplicar la regla de eliminación y escribir 
P(A) = P(B )P(A|B ) + P(B)P(A|B,) + Р(В )Р(А|В.). 


Si nos remitimos al diagrama de árbol de la figura 2.15 encontramos que las tres ramas 
dan las probabilidades 

Р(В,)Р(А|В,) = (0.3)(0.02) = 0.006, 

Р(В,)Р(А|В,) = (0.45)(0.03) = 0.0135, 

P(B,)P(A|B,) = (0.25)(0.02) = 0.005, 


еп consecuencia, 


P(A) = 0.006 + 0.0135 + 0.005 = 0.0245. J 
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В, Р(А|В;) = 0.02 A 


v 
м 
L, 
Р(В›) = 0.45 Р(А|В›) = 0.03 А 
Вә 
A 
9) 


S 
Ba Р(А|Вз)=0.02 
Figura 2.15: Diagrama de árbol para el ejemplo 2.41. 


Regla de Bayes 


Suponga que en lugar de calcular P(A) mediante la regla de eliminación en el ejemplo 
2.41, consideramos el problema de obtener la probabilidad condicional P(B |A). En otras 
palabras, suponga que se selecciona un producto de forma aleatoria y que éste resulta 
defectuoso. ¿Cuál es la probabilidad de que este producto haya sido ensamblado con la 
máquina В? Las preguntas de este tipo se pueden contestar usando el siguiente teorema, 
denominado regla de Bayes: 


Teorema 2.14: (Regla de Bayes) 51 los eventos В, B,,..., B, constituyen una partición del espacio 
muestral S, donde P(B) + О para i = 1, 2,...,k, entonces, para cualquier evento A en S, 
tal que P(A) $ 0, 


P(B. ПА Р(В,)Р(А|В, 
P(B,|A) = n па DEA ийй pa le. la 


>,P(B,N4) Y PIPA [B;) 
і=1 і=1 


Prueba: Mediante la definición de probabilidad condicional, 


P(B, ПА) 


Р(В„|А) = Р(А) > 


y después usando el teorema 2.13 en el denominador, tenemos 
P(B, ПА P (B,)P (A |В, 
P(B,|A) = козе = ыл, 
>P(B,¡NA) У Р(В)Р(А|В;) 
i=l 


i=l 


J 


que completa la demostración. 


Ejemplo 2.42: | Con referencia al ejemplo 2.41, si se elige al azar un producto y se encuentra que está 
defectuoso, ¿cuál es la probabilidad de que haya sido ensamblado con la máquina B,? 
Solución: Podemos utilizar la regla de Bayes para escribir 


Р(Вз)Р(А |Вз) 
Р(ВІ)Р(А |В) +Р(В:)Р(А |В) + P(B3)P(A|B3)” 


Р(Вз|А) = 


76 


Capítulo 2 Probabilidad 


y después al sustituir las probabilidades calculadas en el ejemplo 2.41, tenemos 


Р(Вз|А) = 


0.005 0.005 10 


0.006 + 0.0135 + 0.005 0.0245 49' 


En vista del hecho de que se seleccionó un producto defectuoso, este resultado su- 
giere que probablemente no fue ensamblado con la máquina B,. JJ 


Ejemplo 2.43: | Una empresa de manufactura emplea tres planos analíticos para el diseño y desarrollo de 


un producto específico. Por razones de costos los tres se utilizan en momentos diferen- 
tes. De hecho, los planos 1, 2 y 3 se utilizan para 30%, 20% y 50% de los productos, 
respectivamente. La tasa de defectos difiere en los tres procedimientos de la siguiente 
manera, 

P(D|P ) = 0.01, P(D|P,)=0.03, P(D|P,) = 0.02, 


en donde P(DIP) es la probabilidad de que un producto esté defectuoso, dado el plano j. 
Si se observa un producto al azar y se descubre que está defectuoso, ¿cuál de los planos 


tiene más probabilidades de haberse utilizado y, por lo tanto, de ser el responsable? 
Solución: A partir del planteamiento del problema 


Р(Р) = 0.30, P(P,)=0.20 у Р(Р,) = 0.50, 


debemos calcular P(P |D) para j = 1, 2, 3. La regla de Bayes (teorema 2.14) muestra 


P(P¡|D) = 


Р(Р\)Р(Ю|Р\) 


P (P1)P(D|P1) + P(P2)P (D |Р») + P (P3)P (D |P3) 
(0.30)(0.01) 


2 = 0.158. 


= (0.3)(0.01) + (0.20)(0.03) + (0.50)(0.02) 0.019 


De igual manera, 


Р(Р›|р) = 0.019 


(0.03)(0.20) 


(0.02)(0.50) 


0.316 у P (P3|D) = то 


= 0.526. 


La probabilidad condicional de un defecto, dado el plano 3, es Іа mayor de las tres; por 
consiguiente, un defecto en un producto elegido al azar tiene más probabilidad de ser el 
resultado de haber usado el plano 3. J 

La regla de Bayes, un método estadístico llamado método bayesiano, ha adquirido 
muchas aplicaciones. En el capítulo 18 estudiaremos una introducción al método bayesiano. 


Ejercicios 


2.95 Еп cierta región del país se sabe por experiencia 
que la probabilidad de seleccionar un adulto mayor de 
40 años de edad con cáncer es 0.05. Si la probabilidad 
de que un doctor diagnostique de forma correcta que 
una persona con cáncer tiene la enfermedad es 0.78, y 
la probabilidad de que diagnostique de forma incorrec- 
ta que una persona sin cáncer tiene la enfermedad es 
0.06, ¿cuál es la probabilidad de que a un adulto mayor 
de 40 años se le diagnostique cáncer? 


2.96 La policía planea hacer respetar los límites de 
velocidad usando un sistema de radar en 4 diferentes 
puntos a las orillas de la ciudad. Las trampas de radar en 
cada uno de los 51005 L, L, L, y L, operarán 40%, 
30 %, 20% y 30% del tiempo. Si una persona que excede 
el límite de velocidad cuando va a su trabajo tiene proba- 
bilidades de 0.2, 0.1, 0.5 y 0.2, respectivamente, de pasar 
por esos lugares, ¿cuál es la probabilidad de que reciba 
una multa por conducir con exceso de velocidad? 


Ejercicios de repaso 


2.97 Remítase al ejercicio 2.95. ¿Cuál es la probabi- 
lidad de que una persona a la que se le diagnostica cán- 
cer realmente tenga la enfermedad? 


2.98 Sien el ejercicio 2.96 la persona es multada por 
conducir con exceso de velocidad en su camino al tra- 
bajo, ¿cuál es la probabilidad de que pase por el siste- 
ma de radar que se ubica en £,? 


2.99 Suponga que los cuatro inspectores de una fábri- 
ca de película colocan la fecha de caducidad en cada 
paquete de película al final de la línea de montaje. John, 
quien coloca la fecha de caducidad en 20% de los pa- 
quetes, no logra ponerla en uno de cada 200 paquetes; 
Tom, quien la coloca en 60% de los paquetes, no logra 
ponerla en uno de cada 100 paquetes; Jeff, quien la co- 
loca en 15% de los paquetes, no lo hace una vez en 
cada 90 paquetes; y Pat, que fecha 5% de los paquetes, 
falla en uno de cada 200 paquetes. Si un cliente se que- 
ja de que su paquete de película no muestra la fecha de 
caducidad, ¿cuál es la probabilidad de que haya sido 
inspeccionado por John? 


2.100 Una empresa telefónica regional opera tres es- 
taciones de retransmisión idénticas en diferentes sitios. 
A continuación se muestra el número de desperfectos 
en cada estación reportados durante un año y las causas 
de éstos. 


Ejercicios de repaso 


2.103 Un suero de la verdad tiene la propiedad de que 
90% de los sospechosos culpables se juzgan de forma 
adecuada, mientras que, por supuesto, 10% de los sos- 
pechosos culpables erróneamente se consideran ino- 
centes. Por otro lado, a los sospechosos inocentes se les 
juzga de manera errónea 1% de las veces. Si se aplica 
el suero a un sospechoso, que se selecciona de un grupo 
de sospechosos en el cual sólo 5% ha cometido un de- 
lito, y éste indica que es culpable, ¿cuál es la probabili- 
dad de que sea inocente? 


2.104 Un alergólogo afirma que 50% de los pacientes 
que examina son alérgicos a algún tipo de hierba. ¿Cuál 
es la probabilidad de que... 
a) exactamente 3 de sus 4 pacientes siguientes sean 
alérgicos a hierbas? 
b) ninguno de sus 4 pacientes siguientes sea alérgico 
a hierbas? 


2.105 Mediante la comparación de las regiones apro- 
piadas en un diagrama de Venn, verifique que 

а) (Ап В)О(Ап В”)=А; 

b) А'П\(В' О) С) = (А'П В”) О (А' ПО). 


77 
Estación A В С 
Problemas соп el suministro de electricidad 2 1 1 
Falla de la computadora 3-2 
Fallas del equipo eléctrico 5 4 2 
Fallas ocasionadas por otros errores humanos 7 5 5 


Suponga que se reporta una falla y que se descubre que 
fue ocasionada por otros errores humanos. ¿Cuál es la 
probabilidad de que provenga de la estación C? 


2.101 Una cadena de tiendas de pintura produce y 
vende pintura de látex y semiesmaltada. De acuerdo 
con las ventas a largo plazo, la probabilidad de que un 
cliente compre pintura de látex es 0.75. De los que 
compran pintura de látex, 60 % también compra rodi- 
llos. Sin embargo, sólo 30 % de los que compran pin- 
tura semiesmaltada compra rodillos. Un comprador 
que se selecciona al azar adquiere un rodillo y una la- 
ta de pintura. ¿Cuál es la probabilidad de que sea pin- 
tura de látex? 


2.102 Denote como A, B y С a los eventos de que un 
gran premio se encuentra detrás de las puertas A, B y C, 
respectivamente. Suponga que elige al azar una puerta, 
por ejemplo la A. El presentador del juego abre una 
puerta, por ejemplo la B, y muestra que no hay un pre- 
mio detrás de ella. Ahora, el presentador le da la opción 
de conservar la puerta que eligió (А) o de cambiarla por 
la puerta que queda (C). Utilice la probabilidad para 
explicar si debe o no hacer el cambio. 


2.106 Las probabilidades de que una estación de servi- 
cio bombee gasolina en 0, 1, 2, 3, 4, 5 o más automóviles 
durante cierto periodo de 30 minutos son, respectiva- 
mente, 0.03, 0.18, 0.24, 0.28, 0.10 y 0.17. Calcule la pro- 
babilidad de que en este periodo de 30 minutos 

a) más de 2 automóviles reciban gasolina; 


b) alo sumo 4 automóviles reciban gasolina; 


с) 4 о más automóviles reciban gasolina. 


2.107 ¿Cuántas manos de bridge que contengan 4 es- 
padas, 6 diamantes, 1 trébol y 2 corazones son posi- 
bles? 


2.108 Si la probabilidad de que una persona cometa 
un error en su declaración de impuestos sobre la renta 
es 0.1, calcule la probabilidad de que 
a) cada una de cuatro personas no relacionadas co- 
meta un error; 
b) el señor Jones y la señora Clark cometan un error, 
y el señor Roberts y la señora Williams no come- 
tan errores. 
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2.109 Una empresa industrial grande usa tres moteles 
locales para ofrecer hospedaje nocturno a sus clientes. 
Se sabe por experiencia que a 20% de los clientes se le 
asigna habitaciones en el Ramada Inn, a 50% en el She- 
raton y a 30% en el Lakeview Motor Lodge. Si hay una 
falla en la plomería en 5% de las habitaciones del Ra- 
mada Inn, en 4% de las habitaciones del Sheraton y en 
8% de las habitaciones del Lakeview Motor Lodge, 
¿cuál es la probabilidad de que... 
a) aun cliente se le asigne una habitación en la que 
falle la plomería? 
b) auna persona que ocupa una habitación en la que 
falla la plomería se le haya hospedado en el Lake- 
view Motor Lodge? 


2.110 La probabilidad de que un paciente se recupere 
de una delicada operación de corazón es 0.8. ¿Cuál es 
la probabilidad de que... 
a) exactamente 2 de los siguientes 3 pacientes a los 
que se somete a esta operación sobrevivan? 
b) los siguientes 3 pacientes que tengan esta opera- 
ción sobrevivan? 


2.111 Se sabe que 2/3 de los reclusos en cierta prisión 
federal son menores de 25 años de edad. También se 
sabe que 3/5 de los reos son hombres y que 5/8 son mu- 
jeres de 25 años de edad o mayores. ¿Cuál es la proba- 
bilidad de que un prisionero seleccionado al azar de esta 
prisión sea mujer y tenga al menos 25 años de edad? 


2.112 Si se tienen 4 manzanas rojas, 5 verdes y 6 
amarillas, ¿cuántas selecciones de 9 manzanas se pue- 
den hacer si se deben seleccionar 3 de cada color? 


2.113 De una caja que contiene 6 bolas negras y 4 
verdes se extraen 3 bolas sucesivamente y cada bola se 
reemplaza en la caja antes de extraer la siguiente. ¿Cuál 
es la probabilidad de que... 

a) las 3 sean del mismo color? 

b) cada color esté representado? 


2.114 Un cargamento de 12 televisores contiene tres 
defectuosos. ¿De cuántas formas puede un hotel com- 
prar 5 de estos aparatos y recibir al menos 2 defectuosos? 


2.115 Cierto organismo federal emplea a tres empresas 
consultoras (А, B y С) con probabilidades de 0.40, 0.35 
y 0.25, respectivamente. Se sabe por experiencia que 
las probabilidades de que las empresas rebasen los cos- 
tos son 0.05, 0.03 y 0.15, respectivamente. Suponga 
que el organismo experimenta un exceso en los costos. 

a) ¿Cuál es la probabilidad de que la empresa consul- 

tora implicada sea la С? 
b) ¿Cuál es la probabilidad de que sea la 4? 


2.116 Un fabricante estudia los efectos de la tempe- 
ratura de cocción, el tiempo de cocción y el tipo de 
aceite para la cocción al elaborar papas fritas. Se utili- 
zan 3 diferentes temperaturas, 4 diferentes tiempos de 
cocción y 3 diferentes aceites. 
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a) ¿Cuál es el número total de combinaciones a estu- 
diar? 

b) ¿Cuántas combinaciones se utilizarán para cada 
tipo de aceite? 

c) Analice por qué las permutaciones no intervienen 
en este ejercicio. 


2.117 Considere la situación del ejercicio 2.116 y su- 
ponga que el fabricante puede probar sólo dos combi- 
naciones en un día. 
a) ¿Cuál es la probabilidad de que elija cualquier 
conjunto dado de 2 corridas? 
b) ¿Cuál es la probabilidad de que utilice la temperatu- 
ra más alta en cualquiera de estas 2 combinaciones? 


2.118 Se sabe que existe una probabilidad de 0.07 de 
que las mujeres de más de 60 años desarrollen cierta 
forma de cáncer. Se dispone de una prueba de sangre 
que, aunque no es infalible, permite detectar la enferme- 
dad. De hecho, se sabe que 10 % de las veces la prueba 
da un falso negativo (es decir, la prueba da un resultado 
negativo de manera incorrecta) y 5 % de las veces la 
prueba da un falso positivo (es decir, la prueba da un 
resultado positivo de manera incorrecta). Si una mujer 
de más de 60 años se somete a la prueba y recibe un 
resultado favorable (es decir, negativo), ¿qué probabili- 
dad hay de que tenga la enfermedad? 


2.119 Un fabricante de cierto tipo de componente 
electrónico abastece a los proveedores en lotes de 20. 
Suponga que 60% de todos los lotes no contiene com- 
ponentes defectuosos, que 30% contiene un componen- 
te defectuoso y que 10% contiene dos componentes 
defectuosos. Si se elige un lote del que se extraen alea- 
toriamente dos componentes, los cuales se prueban y 
ninguno resulta defectuoso, 
a) ¿Cuál es la probabilidad de que haya cero compo- 
nentes defectuosos en el lote? 
b) ¿Cuál es la probabilidad de que haya un compo- 
nente defectuoso en el lote? 
c) ¿Cuál es la probabilidad de que haya dos compo- 
nentes defectuosos en el lote? 


2.120 Existe una extraña enfermedad que sólo afecta 
a uno de cada 500 individuos. Se dispone de una prueba 
para detectarla, pero, por supuesto, ésta no es infalible. 
Un resultado correcto positivo (un paciente que real- 
mente tiene la enfermedad) ocurre 95% de las veces; en 
tanto que un resultado falso positivo (un paciente que 
no tiene la enfermedad) ocurre 1% de las veces. Si un 
individuo elegido al azar se somete a prueba y se obtie- 
ne un resultado positivo, ¿cuál es la probabilidad de 
que realmente tenga la enfermedad? 


2.121 Una empresa constructora emplea a dos inge- 
nieros de ventas. El ingeniero 1 hace el trabajo de esti- 
mar costos en 70% de las cotizaciones solicitadas a la 
empresa. El ingeniero 2 hace lo mismo en 30% de las 
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cotizaciones. Se sabe que la tasa de error para el inge- 
niero 1 es tal que la probabilidad de encontrar un error 
en su trabajo es 0.02; mientras que la probabilidad de 
encontrar un error en el trabajo del ingeniero 2 es 0.04. 
Suponga que al revisar una solicitud de cotización se 
encuentra un error grave en la estimación de los costos. 
¿Qué ingeniero supondría usted que hizo los cálculos? 
Explique su respuesta y muestre todo el desarrollo. 


2.122 En el campo del control de calidad a menudo 
se usa la ciencia estadística para determinar si un pro- 
ceso está “fuera de control”. Suponga que el proceso, 
de hecho, está fuera de control y que 20 por ciento de 
los artículos producidos tiene defecto. 

a) Si tres artículos salen en serie de la línea de pro- 
ducción, ¿cuál es la probabilidad de que los tres 
estén defectuosos? 

b) Si salen cuatro artículos en serie, ¿cuál es la proba- 
bilidad de que tres estén defectuosos? 


2.123 En una planta industrial se está realizando un 
estudio para determinar la rapidez con la que los traba- 
jadores lesionados regresan a sus labores después del 
percance. Los registros demuestran que 10% de los tra- 
bajadores lesionados son llevados al hospital para su 
tratamiento y que 15% regresan a su trabajo al día si- 
guiente. Además, los estudios demuestran que 2% son 
llevados al hospital y regresan al trabajo al día siguien- 
te. Si un trabajador se lesiona, ¿cuál es la probabilidad 
de que sea llevado al hospital, de que regrese al trabajo 
al día siguiente, o de ambas cosas? 


2.124 Una empresa acostumbra capacitar operadores 
que realizan ciertas actividades en la línea de produc- 
ción. Se sabe que los operadores que asisten al curso de 
capacitación son capaces de cumplir sus cuotas de pro- 
ducción 90% de las veces. Los nuevos operarios que no 
toman el curso de capacitación sólo cumplen con sus 
cuotas 65% de las veces. Cincuenta por ciento de los 
nuevos operadores asisten al curso. Dado que un nuevo 
operador cumple con su cuota de producción, ¿cuál es 
la probabilidad de que haya asistido al curso? 


2.125 Una encuesta aplicada a quienes usan un soft- 
ware estadístico específico indica que 10% no quedó 
satisfecho. La mitad de quienes no quedaron satisfe- 
chos le compraron el sistema al vendedor A. También 
se sabe que 20% de los encuestados se lo compraron al 


vendedor A. Dado que el proveedor del paquete de soft- 
ware fue el vendedor A, ¿cuál es la probabilidad de que 
un usuario específico haya quedado insatisfecho? 


2.126 Durante las crisis económicas se despide a 
obreros y a menudo se les reemplaza con máquinas. Se 
revisa la historia de 100 trabajadores cuya pérdida del 
empleo se atribuye a los avances tecnológicos. Para 
cada uno de ellos se determinó si obtuvieron un empleo 
alternativo dentro de la misma empresa, si encontraron 
un empleo en la misma área de otra empresa, si encon- 
traron trabajo en una nueva área o si llevan desemplea- 
dos más de un año. Además, se registró la situación 
sindical de cada trabajador. La siguiente tabla resume 
los resultados. 


No 
Sindicalizado sindicalizado 
Está en la misma empresa 40 15 
Está en otra empresa (misma área) 13 10 
Está en una nueva área 4 11 
Está desempleado 2 5 


а) Si un trabajador seleccionado encontró empleo en 
la misma área de una nueva empresa, ¿cuál es la 
probabilidad de que sea miembro de un sindicato? 

Ь) Si el trabajador es miembro de un sindicato, ¿cuál 
es la probabilidad de que esté desempleado desde 
hace un año? 


2.127 Hay 50% de probabilidad de que la reina tenga 
el gen de la hemofilia. Si es portadora, entonces cada 
uno de los príncipes tiene 50% de probabilidad inde- 
pendiente de tener hemofilia. Si la reina no es portado- 
ra, el príncipe no tendrá la enfermedad. Suponga que la 
reina tuvo tres príncipes que no padecen la enfermedad, 
¿cuál es la probabilidad de que la reina sea portadora 
del gen? 


2.128 Proyecto de equipo: Entregue a cada estu- 
diante una bolsa de chocolates М&М y forme equipos 
de 5 о б estudiantes. Calcule la distribución de frecuen- 
cia relativa del color de los М&М para cada equipo. 
a) ¿Cuál es su probabilidad estimada de elegir un 
chocolate amarillo al azar? ¿Y uno rojo? 
b) Ahora haga el mismo cálculo para todo el grupo. 
¿Cambiaron las estimaciones? 
c) ¿Cree que en un lote procesado existe el mismo 
número de chocolates de cada color? Comente al 
respecto. 


2.8 Posibles riesgos y errores conceptuales; relación con el material de 


otros capítulos 


Este capítulo incluye las definiciones, reglas y teoremas fundamentales que convierten a 
la probabilidad en una herramienta importante para la evaluación de sistemas científicos 
y de ingeniería. A menudo estas evaluaciones toman la forma de cálculos de probabili- 
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dad, como se ilustra en los ejemplos y en los ejercicios. Conceptos como independencia, 
probabilidad condicional, regla de Bayes y otros suelen ser muy adecuados para resolver 
problemas prácticos en los que se busca obtener un valor de probabilidad. Abundan las 
ilustraciones en los ejercicios. Vea, por ejemplo, los ejercicios 2.100 y 2.101. En éstos y 
en muchos otros ejercicios se realiza una evaluación juiciosa de un sistema científico, a 
partir de un cálculo de probabilidad, utilizando las reglas y las definiciones que se estu- 
dian en el capítulo. 

Ahora bien, ¿qué relación existe entre el material de este capítulo y el material de 
otros capítulos? La mejor forma de responder esta pregunta es dando un vistazo al capí- 
tulo 3, ya que en éste también se abordan problemas en los que es importante el cálculo 
de probabilidades. Ahí se ilustra cómo el desempeño de un sistema depende del valor de 
una o más probabilidades. De nuevo, la probabilidad condicional y la independencia 
desempeñan un papel. Sin embargo, surgen nuevos conceptos que permiten tener una 
mayor estructura basada en el concepto de una variable aleatoria y su distribución de 
probabilidad. Recuerde que el concepto de las distribuciones de frecuencias se abordó 
brevemente en el capítulo 1. La distribución de probabilidad muestra, en forma gráfica o 
en una ecuación, toda la información necesaria para describir una estructura de probabi- 
lidad. Por ejemplo, en el ejercicio de repaso 2.122 la variable aleatoria de interés es el 
número de artículos defectuosos, una medición discreta. Por consiguiente, la distribu- 
ción de probabilidad revelaría la estructura de probabilidad para el número de artículos 
defectuosos extraídos del número elegido del proceso. Cuando el lector avance al capí- 
tulo 3 y los siguientes, será evidente para él que se requieren suposiciones para determi- 
nar y, por lo tanto, utilizar las distribuciones de probabilidad en la resolución de 
problemas científicos. 


CAPÍTULO 3 


Variables aleatorias y distribuciones 
de probabilidad 


3.1 Concepto de variable aleatoria 


Definición 3.1: 


La estadística realiza inferencias acerca de las poblaciones y sus características. Se 
llevan a cabo experimentos cuyos resultados se encuentran sujetos al azar. La prueba 
de un número de componentes electrónicos es un ejemplo de experimento estadísti- 
co, un concepto que se utiliza para describir cualquier proceso mediante el cual se 
generan varias observaciones al azar. A menudo es importante asignar una descripción 
numérica al resultado. Por ejemplo, cuando se prueban tres componentes electrónicos, 
el espacio muestral que ofrece una descripción detallada de cada posible resultado se 
escribe como 


S = {NNN, NND, NDN, DNN, NDD, DND, DDN, DDD), 


donde N denota “no defectuoso”, y D, “defectuoso”. Es evidente que nos interesa el 
número de componentes defectuosos que se presenten. De esta forma, a cada punto en 
el espacio muestral se le asignará un valor numérico de О, 1, 2 o 3. Estos valores son, 
por supuesto, cantidades aleatorias determinadas por el resultado del experimento. Se 
pueden ver como valores que toma la variable aleatoria X, es decir, el número de artícu- 
los defectuosos cuando se prueban tres componentes electrónicos. 


Una variable aleatoria es una función que asocia un número real con cada elemento 
del espacio muestral. 


Utilizaremos una letra mayúscula, digamos X, para denotar una variable aleatoria, y su 
correspondiente letra minúscula, x en este caso, para uno de sus valores. En el ejemplo 
de la prueba de componentes electrónicos observamos que la variable aleatoria X toma 
el valor 2 para todos los elementos en el subconjunto 


Е = (DDN, DND, NDD} 


del espacio muestral 5. Esto es, cada valor posible de X representa un evento que es un 
subconjunto del espacio muestral para el experimento dado. 
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Ejemplo 3.1: | De una urna que contiene 4 bolas rojas y 3 negras se sacan 2 bolas de manera sucesiva, 


sin reemplazo. Los posibles resultados y los valores y de la variable aleatoria Y, donde Y 
es el número de bolas rojas, son 


Espacio muestral y 
RR 2 
RN 1 
NR 1 
NN 0 


Jl 


Ejemplo 3.2: ¡El empleado de un almacén regresa tres cascos de seguridad al azar a tres obreros de un 


Solución: 


taller siderúrgico que ya los habían probado. Si Smith, Jones y Brown, en ese orden, 
reciben uno de los tres cascos, liste los puntos muestrales para los posibles órdenes en que 
el empleado del almacén regresa los cascos, después calcule el valor m de la variable 
aleatoria M que representa el número de emparejamientos correctos. 

Si S, J y B representan, respectivamente, los cascos que recibieron Smith, Jones y Brown, 
entonces los posibles arreglos en los cuales se pueden regresar los cascos y el número de 
emparejamientos correctos son 


Espacio muestral m 
SJB 3 

SBJ 1 

BJS 1 
1 

0 

0 


JSB 
JBS 


BSJ I 


En cada uno de los dos ejemplos anteriores, el espacio muestral contiene un número 
finito de elementos. Por el contrario, cuando lanzamos un dado hasta que salga un 5, 
obtenemos un espacio muestral con una secuencia de elementos interminable, 


S = {F, NF, NNF, МММР,...}, 


donde F y N representan, respectivamente, la ocurrencia y la no ocurrencia de un 5. Sin 
embargo, incluso en este experimento el número de elementos se puede igualar a la can- 
tidad total de números enteros, de manera que hay un primer elemento, un segundo, un 
tercero y así sucesivamente, por lo que se pueden contar. 

Hay casos en que la variable aleatoria es categórica por naturaleza en los cuales se 
utilizan las llamadas variables ficticias. Un buen ejemplo de ello es el caso en que la 
variable aleatoria es binaria por naturaleza, como se indica a continuación. 


Ejemplo 3.3: | 


Considere la condición en que salen componentes de la línea de ensamble y se les clasi- 
fica como defectuosos o no defectuosos. Defina la variable aleatoria X mediante 


X = 1, siel componente está defectuoso, 
0, siel componente no está defectuoso. 
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Evidentemente la asignación de 1 о 0 es arbitraria, aunque bastante conveniente, lo cual 
quedará más claro en capítulos posteriores. La variable aleatoria en la que se eligen 0 y 1 
para describir los dos posibles valores se denomina variable aleatoria de Bernoulli. I 


En los siguientes ejemplos veremos más casos de variables aleatorias. 


Ejemplo 3.4: | Los estadísticos utilizan planes de muestreo para aceptar o rechazar lotes de materiales. 


Suponga que uno de los planes de muestreo implica obtener una muestra independiente 
de 10 artículos de un lote de 100, en el que 12 están defectuosos. 

Si X representa a la variable aleatoria, definida como el número de artículos que 
están defectuosos en la muestra de 10, la variable aleatoria toma los valores 0, 1, 2,..., 
9, 10. J 


Ejemplo 3.5: | Suponga que un plan de muestreo implica obtener una muestra de artículos de un proce- 


so hasta que se encuentre uno defectuoso. La evaluación del proceso dependerá de cuán- 
tos artículos consecutivos se observen. En este caso, sea X una variable aleatoria que se 
define como el número de artículos observados antes de que salga uno defectuoso. Si N 
representa un artículo no defectuoso y D uno defectuoso, los espacios muestrales son 
5 = {D} dado que X = 1, S = {ND} dado que X = 2, 5 = {NND} dado que X = 3, y así 
sucesivamente. 2 


Ејетріо 3.6: 


Existe interés por la proporción de personas que responden а cierta encuesta enviada por 
correo. Sea X tal proporción. X es una variable aleatoria que toma todos los valores de x 
para los cuales 0 < x < 1. 2 


Ejemplo 3.7: | Sea X la variable aleatoria definida como el tiempo que pasa, en horas, para que un radar 


Definición 3.2: 


Definición 3.3: 


detecte entre conductores sucesivos a los que exceden los límites de velocidad. La varia- 
ble aleatoria X toma todos los valores de x para los que x > 0. J 


Si un espacio muestral contiene un número finito de posibilidades, o una serie intermi- 
nable con tantos elementos como números enteros existen, se llama espacio muestral 
discreto. 


Los resultados de algunos experimentos estadísticos no pueden ser ni finitos ni conta- 
bles. Éste es el caso, por ejemplo, en una investigación que se realiza para medir las 
distancias que recorre un automóvil de cierta marca, en una ruta de prueba preestableci- 
da, con cinco litros de gasolina. Si se asume que la distancia es una variable que se mide 
con algún grado de precisión, entonces salta a la vista que tenemos un número infinito 
de distancias posibles en el espacio muestral, que no se pueden igualar a la cantidad total 
de números enteros. Lo mismo ocurre en el caso de un experimento en que se registra el 
tiempo requerido para que ocurra una reacción química, en donde una vez más los posi- 
bles intervalos de tiempo que forman el espacio muestral serían un número infinito e 
incontable. Vemos ahora que no todos los espacios muestrales necesitan ser discretos. 


Si un espacio muestral contiene un número infinito de posibilidades, igual al número de 
puntos en un segmento de recta, se le denomina espacio muestral continuo. 


Una variable aleatoria se llama variable aleatoria discreta si se puede contar su conjun- 
to de resultados posibles. En los ejemplos 3.1 a 3.5 las variables aleatorias son discretas. 
Sin embargo, una variable aleatoria cuyo conjunto de valores posibles es un intervalo 
completo de números no es discreta. Cuando una variable aleatoria puede tomar valores 
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en una escala continua, se le denomina variable aleatoria continua. A menudo los po- 
sibles valores de una variable aleatoria continua son precisamente los mismos valores 
incluidos en el espacio muestral continuo. Es evidente que las variables aleatorias des- 
critas en los ejemplos 3.6 y 3.7 son variables aleatorias continuas. 

En la mayoría de los problemas prácticos las variables aleatorias continuas repre- 
sentan datos medidos, como serían todos los posibles pesos, alturas, temperaturas, dis- 
tancias O periodos de vida; en tanto que las variables aleatorias discretas representan 
datos por conteo, como el número de artículos defectuosos en una muestra de k artículos o 
el número de accidentes de carretera por año en una entidad específica. Observe que 
tanto Y como M, las variables aleatorias de los ejemplos 3.1 y 3.2, representan datos por 
conteo: Y el número de bolas rojas y M el número de emparejamientos correctos de cascos. 


3.2 Distribuciones discretas de probabilidad 


Definición 3.4: 


Una variable aleatoria discreta toma cada uno de sus valores con cierta probabilidad. Al 
lanzar una moneda tres veces, la variable X, que representa el número de caras, toma 
el valor 2 con 3/8 de probabilidad, pues 3 de los 8 puntos muestrales igualmente proba- 
bles tienen como resultado dos caras y una cruz. Si se suponen pesos iguales para los 
eventos simples del ejemplo 3.2, la probabilidad de que ningún obrero reciba el casco 
correcto, es decir, la probabilidad de que M tome el valor cero, es 1/3. Los valores posi- 
bles m de M y sus probabilidades son 


Observe que los valores de m agotan todos los casos posibles, por lo tanto, las probabi- 
lidades suman 1. 

Con frecuencia es conveniente representar todas las probabilidades de una variable 
aleatoria X usando una fórmula, la cual necesariamente sería una función de los valores 
numéricos x que denotaremos con f(x), g(x), r(x) y así sucesivamente. Por lo tanto, escri- 
bimos f(x) = Р(Х = х); es decir, f(3) = P(X = 3). Al conjunto de pares ordenados (x, 
Ј(х)) se le llama función de probabilidad, función de masa de probabilidad o distri- 
bución de probabilidad de la variable aleatoria discreta X. 


El conjunto de pares ordenados (х, f(x)) es una función de probabilidad, una función 
de masa de probabilidad o una distribución de probabilidad de la variable aleatoria 
discreta X si, para cada resultado x posible, 


1. f(x) >0, 
2 з= 


3. P(X =x) = f(x). 


Ejemplo 3.8: ¡Un embarque de 20 computadoras portátiles similares para una tienda minorista contie- 


Solución: 


ne 3 que están defectuosas. Si una escuela compra al azar 2 de estas computadoras, cal- 
cule la distribución de probabilidad para el número de computadoras defectuosas. 

Sea X una variable aleatoria cuyos valores x son los números posibles de computadoras 
defectuosas compradas por la escuela. Entonces x sólo puede asumir los números 0, 1 y 
2. Así, 
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3y (17 3y (17 


20 > 20 > 
E) 5% ш. 
3y (17 
( 3 
д) РО 02 - 000) = ——. 
РО) = РОХ =)= З) = т 
Por consiguiente, la distribución de probabilidad de X es 
х | 0 1 2 
6 51 3 
ЈО) ® 10 Г 


Ejemplo 3.9: 151 una agencia automotriz vende 50% de su inventario de cierto vehículo extranjero 


Solución: 


Definición 3.5: 


equipado con bolsas de aire laterales, calcule una fórmula para la distribución de proba- 
bilidad del número de automóviles con bolsas de aire laterales entre los siguientes 4 ve- 
hículos que venda la agencia. 

Como la probabilidad de vender un automóvil con bolsas de aire laterales es 0.5, los 
2* = 16 puntos del espacio muestral tienen la misma probabilidad de ocurrencia. Por lo 
tanto, el denominador para todas las probabilidades, y también para nuestra función, es 
16. Para obtener el número de formas de vender tres automóviles con bolsas de aire la- 
terales necesitamos considerar el número de formas de dividir 4 resultados en 2 celdas, 
con 3 automóviles con bolsas de aire laterales asignados a una celda, y el modelo sin 
bolsas de aire laterales asignado a la otra. Esto se puede hacer de E) = 4 formas. En 
general, el evento de vender x modelos con bolsas de aire laterales y 4 — x modelos sin 
bolsas de aire laterales puede ocurrir de 6) formas, donde x puede ser 0, 1, 2, 3 o 4. Por 
consiguiente, la distribución de probabilidad f(x) = P(X = x) es 


1 /4 
го) = 1604). рага х = 0, 1, 2,3,4. Г 


Existen muchos problemas en los que desearíamos calcular la probabilidad de que 
el valor observado de una variable aleatoria X sea menor o igual que algún número real 
x. Al escribir Р(х) = Р(Х < x) para cualquier número real x, definimos F(x) como la 
función de la distribución acumulativa de la variable aleatoria X. 


La función de la distribución acumulativa F(x) de una variable aleatoria discreta X 
con distribución de probabilidad f(x) es 


Ех) = Р(Х <x)= УШШ para —оо <х< оо. 


1<x 


Para la variable aleatoria M, el número de emparejamientos correctos en el ejem- 
plo 3.2, tenemos 


1 1 
Е(2) = Р(М <2) =f0)+f()= a 
La función de la distribución acumulativa de M es 
0, para т< 0, 
1, para О< т < 1, 
3, para 1<m< 3, 


l, рага m > 3. 


F(m)= 
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Es necesario observar en particular el hecho de que la función de la distribución acumu- 
lativa es una función no decreciente monótona, la cual no sólo se define para los valores 
que toma la variable aleatoria dada sino para todos los números reales. 


Ejemplo 3.10: | Calcule la función de la distribución acumulativa de la variable aleatoria X del ejemplo 3.9. 
Utilice F(x) para verificar que f(2) = 3/8. 
Solución: El cálculo directo de la distribución de probabilidad del ejemplo 3.9 da /(0) = 1/16, 
FM = 1/4, 0) = 3/8, (3) = 1/4 y £(4) = 1/16. Por lo tanto, 


1 
Aute 


5 
Е(1) =f@) +1) = TA 


11 
FO)=f0 + AD +70) = те: 


15 
FS) =f0) +71) +70) +/63) = те, 


F(4) = FO) +F) +30) +G) +14) = 1. 
Por lo tanto, 


0, para x < 0, 


1, рага 0<х < 1, 


3 
—, para 1< x< 2, 
Е(х)= {15° P 


т, Para 2<х < 3, 


б. para3<x< 4, 


1 para x > 4. 


Entonces, 
11 5 3 


f2) = FQ) Ка) = тє 168 Г 

A menudo es útil ver una distribución de probabilidad en forma gráfica. Se pueden 
graficar los puntos (x, f(x)) del ejemplo 3.9 para obtener la figura 3.1. Si unimos los 
puntos al eje x, ya sea con una línea punteada o con una línea sólida, obtenemos una 
gráfica de función de masa de probabilidad. La figura 3.1 permite ver fácilmente qué 
valores de X tienen más probabilidad de ocurrencia y, en este caso, también indica una 
situación perfectamente simétrica. 

Sin embargo, en vez de graficar los puntos (x, f(x)), lo que hacemos más a menudo 
es construir rectángulos como en la figura 3.2. Aquí los rectángulos se construyen de 
manera que sus bases, con la misma anchura, se centren en cada valor x, y que sus alturas 
igualen a las probabilidades correspondientes dadas por f(x). Las bases se construyen de 
forma tal que no dejen espacios entre los rectángulos. La figura 3.2 se denomina histo- 
grama de probabilidad. 

Como cada base en la figura 3.2 tiene el ancho de una unidad, P(X = x) es igual al 
área del rectángulo centrado en x. Incluso si las bases no tuvieran el ancho de una uni- 
dad, podríamos ajustar las alturas de los rectángulos para que tengan áreas que igualen 
las probabilidades de X de tomar cualquiera de sus valores x. Este concepto de utilizar 
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f(x) f(x) 
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Figura 3.1: Gráfica de función de masa de probabilidad. Figura 3.2: Histograma de probabilidad. 


áreas para representar probabilidades es necesario para nuestro estudio de la distribución 
de probabilidad de una variable aleatoria continua. 

La gráfica de la función de la distribución acumulativa del ejemplo 3.9, que aparece 
como una función escalonada en la figura 3.3, se obtiene graficando los puntos (x, F(x)). 

Ciertas distribuciones de probabilidad se aplican a más de una situación física. La 
distribución de probabilidad del ejemplo 3.9 también se aplica a la variable aleatoria Y, 
donde Y es el número de caras que se obtienen cuando una moneda se lanza 4 veces, о а 
la variable aleatoria W, donde W es el número de cartas rojas que resultan cuando se sacan 
4 cartas al azar de una baraja de manera sucesiva, se reemplaza cada carta y se baraja 
antes de sacar la siguiente. En el capítulo 5 se estudiarán distribuciones discretas espe- 
ciales que se aplican a diversas situaciones experimentales. 


3/4 
1/2 


1/4 


0 1 2 3 4 


Figura 3.3: Función de distribución acumulativa discreta. 


3.3 Distribuciones de probabilidad continua 


Una variable aleatoria continua tiene una probabilidad O de adoptar exactamente cual- 
quiera de sus valores. En consecuencia, su distribución de probabilidad no se puede 
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presentar en forma tabular. En un principio esto parecería sorprendente, pero se vuel- 
ve más probable cuando consideramos un ejemplo específico. Consideremos una varia- 
ble aleatoria cuyos valores son las estaturas de todas las personas mayores de 21 años de 
edad. Entre cualesquiera dos valores, digamos 163.5 y 164.5 centímetros, o incluso entre 
163.99 y 164.01 centímetros, hay un número infinito de estaturas, una de las cuales es 
164 centímetros. La probabilidad de seleccionar al azar a una persona que tenga exacta- 
mente 164 centímetros de estatura en lugar de una del conjunto infinitamente grande de 
estaturas tan cercanas a 164 centímetros que humanamente no sea posible medir la dife- 
rencia es remota, por consiguiente, asignamos una probabilidad O a tal evento. Sin em- 
bargo, esto no ocurre si nos referimos a la probabilidad de seleccionar a una persona que 
mida al menos 163 centímetros pero no más de 165 centímetros de estatura. Aquí nos 
referimos a un intervalo en vez de a un valor puntual de nuestra variable aleatoria. 

Nos interesamos por el cálculo de probabilidades para varios intervalos de variables 
aleatorias continuas como Pía < X < b), P(W > с), etc. Observe que cuando X es 
continua, 


P(a < X <b) = P(a < X < b) + P(X = b) = Pla < X < b). 


Es decir, no importa si incluimos o no un extremo del intervalo. Sin embargo, esto no es 
cierto cuando X es discreta. 

Aunque la distribución de probabilidad de una variable aleatoria continua no se 
puede representar de forma tabular, sí es posible plantearla como una fórmula, la cual 
necesariamente será función de los valores numéricos de la variable aleatoria continua 
X, y como tal se representará mediante la notación funcional f(x). Cuando se trata con 
variables continuas, a f(x) por lo general se le llama función de densidad de probabi- 
lidad, o simplemente función de densidad de X. Como X se define sobre un espacio 
muestral continuo, es posible que f(x) tenga un número finito de discontinuidades. Sin 
embargo, la mayoría de las funciones de densidad que tienen aplicaciones prácticas en el 
análisis de datos estadísticos son continuas y sus gráficas pueden tomar cualesquiera de 
varias formas, algunas de las cuales se presentan en la figura 3.4. Como se utilizarán 
áreas para representar probabilidades y éstas son valores numéricos positivos, la función 
de densidad debe caer completamente arriba del eje x. 


(b) (c) (a) 


Figura 3.4: Funciones de densidad típicas. 
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Una función de densidad de probabilidad se construye de manera que el área bajo su 
curva limitada por el eje x sea igual a 1, cuando se calcula en el rango de X para el que 
se define f(x). Como este rango de X es un intervalo finito, siempre es posible extender 
el intervalo para que incluya a todo el conjunto de números reales definiendo f(x) como 
cero en todos los puntos de las partes extendidas del intervalo. En la figura 3.5 la proba- 
bilidad de que X tome un valor entre a y b es igual al área sombreada bajo la función de 
densidad entre las ordenadas en x = a y x = b, y a partir del cálculo integral está dada por 


b 
Р(а<Х < b) =f f(x)dx. 
f(x) a 


a b 


Figura 3.5: P(a < X < b). 


Definición 3.6: La función f(x) es una función de densidad de probabilidad (fdp) para la variable 
aleatoria continua X, definida en el conjunto de números reales, si 


1. f(x) > 0, para toda x € R. 
ОиВ 
3. Pla<X<b)= [ fŒ) ах. 


Ejemplo 3.11: | Suponga que el error en la temperatura de reacción, еп °С, en un experimento de labora- 
torio controlado, es una variable aleatoria continua X que tiene la función de densidad de 


probabilidad 
Ж, 14% 8 2, 


0, en otro caso. 


a) Verifique que f(x) es una función de densidad. 
b) Calcule P(0 < X < 1). 


Solución: Usamos la definición 3.6. 
a) Evidentemente, f(x) > 0. Para verificar la condición 2 de la definición 3.6 tenemos 


оо 2, 2 З 
Xx Xx 8 1 
dx = dx =^, = =1. 
Lo 6 | ст мыс ше а 
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b) Si usamos la fórmula 3 de la definición 3.6, obtenemos 


o 9 J 


1 
РОХ) = | Fax = 
0 


Definición 3.7: La función de distribución acumulativa F(x), de una variable aleatoria continua X con 
función de densidad f(x), es 


F(x) = Р(Х =0=| f(t) а, para – œ < х < оо. 


Сото una consecuencia inmediata de la definición 3.7 se pueden escribir los dos resul- 


tados, 
dF (x) 


ах” 


Р(а<Х < b = F(b) – F(a) у f(x) = 


si existe la derivada. 


Ejemplo 3.12: | Calcule F(x) para la función de densidad del ejemplo 3.11 y utilice el resultado para 
evaluar P(0 < X < 1). 
Solución: Para —1 < x < 2, 


xX X [2 £? 
кю=/ soa- f ES 9 


Por lo tanto, 


0, х<—1, 
Е(х) = 224 -1<x<2, 
ll 222 


La función de la distribución acumulativa F(x) se expresa en la figura 3.6. Entonces, 
2 1 1 
Р(0<Х <1)=F(1)-F(0)=---=-, 
( ) ЕР= отоо 
que coincide con el resultado que se obtuvo al utilizar la función de densidad en el ејет- 
plo 3.11. JJ 


Ejemplo 3.13: ¡El Departamento de Energía (DE) asigna proyectos mediante licitación y, por lo general, 
estima lo que debería ser una licitación razonable. Sea b el estimado. El DE determinó 


que la función de densidad de la licitación ganadora (baja) es 


5 2 
>» =р<у < 2р, 
0, en otro caso. 


Calcule F(y) y utilice el resultado para determinar la probabilidad de que la licitación 
ganadora sea menor que la estimación preliminar b del DE. 
Solución: Para 2b/5 < y < 2b, 


y 


и Ж 
2b/5 8b 4 


2o 5 5t 
ro= f =D = 3 
2/5 8b 8b 
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=i 


0 1 2 


Figura 3.6: Función de distribución acumulativa continua. 


Por consiguiente, 


F(y)= 


0, y < ib, 

Sy 1 2 

Z= 50У < 2Ь, 
1; y > 2b 


Para determinar la probabilidad de que la licitación ganadora sea menor que la estima- 
ción preliminar b de la licitación tenemos 


P(Y <b) = F(b) = 


Ejercicios 


3.1 Clasifique las siguientes variables aleatorias como 
discretas o continuas: 


X: el número de accidentes automovilísticos que 
ocurren al año en Virginia. 


Y: el tiempo para jugar 18 hoyos de golf. 


M: la cantidad de leche que una vaca específica 
produce anualmente. 


N: el número de huevos que una gallina pone 
mensualmente. 


P: el número de permisos para construcción que 
los funcionarios de una ciudad emiten cada mes. 
Q: el peso del grano producido por acre. 


3.2 Un embarque foráneo de 5 automóviles extranje- 
ros contiene 2 que tienen ligeras manchas de pintura. 
Suponga que una agencia recibe 3 de estos automóviles 
al azar y liste los elementos del espacio muestral S 
usando las letras M y N para “manchado” y “sin man- 
cha”, respectivamente; luego asigne a cada punto 


E 
8 


muestral un valor x de la variable aleatoria X que repre- 
senta el número de automóviles con manchas de pintu- 
ra que compró la agencia. 


3.3 Sea W la variable aleatoria que da el número de 
caras menos el número de cruces en tres lanzamientos 
de una moneda. Liste los elementos del espacio mues- 
tral 5 para los tres lanzamientos de la moneda y asigne 
un valor w de W a cada punto muestral. 


3.4 Se lanza una moneda hasta que se presentan 3 ca- 
ras sucesivamente. Liste sólo aquellos elementos del 
espacio muestral que requieren 6 o menos lanzamien- 
tos. ¿Es éste un espacio muestral discreto? Explique su 
respuesta. 


3.5 Determine el valor c de modo que cada una de las 
siguientes funciones sirva como distribución de proba- 
bilidad de la variable aleatoria discreta X: 

а) f(x) = с(х? +4), para x = 0, 1,2,3; 

b) FO) = cC) G?) para x = 0,1,2. 
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3.6 La vida útil, en días, para frascos de cierta medi- 
cina de prescripción es una variable aleatoria que tiene 
la siguiente función de densidad: 


20,000 


Fx) = {= ‚ *>0, 


0, en otro caso. 


Calcule la probabilidad de que un frasco de esta medi- 
cina tenga una vida útil de 

a) al menos 200 días; 

b) cualquier lapso entre 80 y 120 días. 


3.7 El número total de horas, medidas en unidades de 
100 horas, que una familia utiliza una aspiradora en un 
periodo de un año es una variable aleatoria continua X 
que tiene la siguiente función de densidad: 


% 0O<x<l, 
/(х)=42—х, 1<х<2, 
0, en otro caso. 


Calcule la probabilidad de que en un periodo de un año 
una familia utilice su aspiradora 

a) menos de 120 horas; 

b) entre 50 y 100 horas. 


3.8 Obtenga la distribución de probabilidad de la va- 
riable aleatoria W del ejercicio 3.3; suponga que la mo- 
neda está cargada, de manera que existe el doble de 
probabilidad de que ocurra una cara que una cruz. 


3.9 La proporción de personas que responden a cierta 
encuesta enviada por correo es una variable aleatoria 
continua X que tiene la siguiente función de densidad: 


20х+ 2) 
ra= і 


Ох 1, 
0, 


en otro caso. 


a) Demuestre que PO<X<l1)=1. 

b) Calcule la probabilidad de que más de 1/4 pero 
menos de 1/2 de las personas contactadas respon- 
dan a este tipo de encuesta. 


3.10 Encuentre una fórmula para la distribución de 
probabilidad de la variable aleatoria X que represente el 
resultado cuando se lanza un dado una vez. 


3.11 Un embarque de 7 televisores contiene 2 unida- 
des defectuosas. Un hotel compra 3 de los televisores al 
azar. Si x es el número de unidades defectuosas que 
compra el hotel, calcule la distribución de probabilidad 
de X. Exprese los resultados de forma gráfica como un 
histograma de probabilidad. 


3.12 Una empresa de inversiones ofrece a sus clientes 
bonos municipales que vencen después de varios años. 
Dado que la función de distribución acumulativa de 7, 
el número de años para el vencimiento de un bono que 
se elige al azar, es 


O. 0 1, 
p 1<71<3, 
F(t) =} і, 3<1< 5, 
$ ЗЕРТ, 
І, 227, 
calcule 
a) P(T = 5); 
b) P(T > 3); 


с) P(1.4<T < 6); 

а) Р(Т<5|Т> 2); 
3.13 La distribución de probabilidad de X, el número de 
imperfecciones que se encuentran en cada 10 metros 
de una tela sintética que viene en rollos continuos de 
ancho uniforme, está dada por 


x | 0 1 2 3 4 
f(x) 1 0.41 037 016 0.05 0.01 
Construya la función de distribución acumulativa de X. 


3.14 El tiempo que pasa, en horas, para que un radar 
detecte entre conductores sucesivos a los que exceden 
los límites de velocidad es una variable aleatoria conti- 
nua con una función de distribución acumulativa 


P= А х < 0, 


le, x>0. 
Calcule la probabilidad de que el tiempo que pase 
para que el radar detecte entre conductores sucesivos 
а los que exceden los límites de velocidad sea menor de 
12 minutos 
a) usando la función de distribución acumulativa de X; 
b) utilizando la función de densidad de probabilidad 
de X. 


3.15 Calcule la función de distribución acumulativa 
de la variable aleatoria X que represente el número de 
unidades defectuosas en el ejercicio 3.11. Luego, utili- 
ce F(x) para calcular 

a) P(X =1); 

b) P(0<X <2). 


3.16 Construya una gráfica de la función de distribu- 
ción acumulativa del ejercicio 3.15. 


3.17 Una variable aleatoria continua X, que puede to- 
mar valores entre x = 1 y x = 3, tiene una función de 
densidad dada por f(x) = 1/2. 

a) Muestre que el área bajo la curva es igual a 1. 

b) Calcule P(2 < X < 2.5). 

c) Calcule P(X < 1.6). 


Ejercicios 


3.18 Una variable aleatoria continua X, que puede to- 
mar valores entre x = 2 y x = 5, tiene una función de 
densidad dada por f(x) = 2(1 + x)/27. Calcule 

a) P(X < 4); 

b) Р(З<Х < 4). 


3.19 Para la función de densidad del ejercicio 3.17 
calcule F(x). Utilícela para evaluar P(2 < X < 2.5). 


3.20 Para la función de densidad del ejercicio 3.18 
calcule F(x) y utilícela para evaluar P(3 < X < 4). 


3.21 Considere la función de densidad 


_ ух, 0<x<1, 
о) = |, en otro caso. 


a) Evalúe k. 
b) Calcule F(x) y utilice el resultado para evaluar 


P(0.3 < X <0.6). 


3.22 Se sacan tres cartas de una baraja de manera su- 
cesiva y sin reemplazo. Calcule la distribución de pro- 
babilidad para la cantidad de espadas. 


3.23 Calcule la función de distribución acumulativa 
de la variable aleatoria W del ejercicio 3.8. Use F(w) 
para calcular 

a) P(W > 0); 

b) Р(—1<\/ <3). 


3.24 Calcule la distribución de probabilidad para el 
número de discos compactos de jazz cuando, de una 
colección que consta de 5 de jazz, 2 de música clásica 
y 3 de rock, se seleccionan 4 CD al azar. Exprese sus 
resultados utilizando una fórmula. 


3.25 De una caja que contiene 4 monedas de 10 cen- 
tavos y 2 monedas de 5 centavos se seleccionan 3 mo- 
nedas al azar y sin reemplazo. Calcule la distribución 
de probabilidad para el total T de las 3 monedas. Expre- 
se la distribución de probabilidad de forma gráfica 
como un histograma de probabilidad. 


3.26 De una caja que contiene 4 bolas negras y 2 ver- 
des se sacan 3 bolas sucesivamente, cada bola se regre- 
sa a la caja antes de sacar la siguiente. Calcule la 
distribución de probabilidad para el número de bolas 
verdes. 


3.27 El tiempo que pasa, en horas, antes de que una 
parte importante de un equipo electrónico que se utiliza 
para fabricar un reproductor de DVD empiece a fallar 
tiene la siguiente función de densidad: 


a exp(—x/ 2000), x= 0, 


fœ) = | х < 0. 
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a) Calcule F(x). 

b) Determine la probabilidad de que el componente 
(y, por lo tanto, el reproductor de DVD) funcione- 
durante más de 1000 horas antes de que sea nece- 
sario reemplazar el componente. 

c) Determine la probabilidad de que el componente 
falle antes de 2000 horas. 

3.28 Un productor de cereales está consciente de que 
el peso del producto varía ligeramente entre una y otra 
caja. De hecho, cuenta con suficientes datos históricos 
para determinar la función de densidad que describe la 
estructura de probabilidad para el peso (en onzas). Si 
X es el peso, en onzas, de la variable aleatoria, la fun- 
ción de densidad se describe como 


2. 2375<x<?26.25 
_)5 =1 <= > 
ГЕ | en otro caso. 


a) Verifique que sea una función de densidad válida. 

b) Determine la probabilidad de que el peso sea me- 
nor que 24 onzas. 

c) La empresa desea que un peso mayor que 26 onzas 
sea un caso extraordinariamente raro. ¿Cuál será 
la probabilidad de que en verdad ocurra este caso 
extraordinariamente raro? 

3.29 Un factor importante en el combustible sólido 
para proyectiles es la distribución del tamaño de las par- 
tículas. Cuando las partículas son demasiado grandes se 
presentan problemas importantes. A partir de datos de 
producción históricos se determinó que la distribución 
del tamaño (en micras) de las partículas se caracteriza por 

-4 


го С" 


a) Verifique que sea una función de densidad válida. 

b) Evalúe F(x). 

c) ¿Cuál es la probabilidad de que una partícula to- 
mada al azar del combustible fabricado sea mayor 
que 4 micras? 


x>l, 
en otro caso. 


3.30 Las mediciones en los sistemas científicos siem- 
pre están sujetas a variación, algunas veces más que otras. 
Hay muchas estructuras para los errores de medición y 
los estadísticos pasan mucho tiempo modelándolos. Su- 
ponga que el error de medición X de cierta cantidad física 
es determinado por la siguiente función de densidad: 


Hi | zx), _1=х=1, 


0, en otro caso. 

a) Determine k, que representa f(x), una función de 
densidad válida. 

b) Calcule la probabilidad de que un error aleatorio 
en la medición sea menor que Y. 

c) Para esta medición específica, resulta indeseable si 
la magnitud del error (es decir, |x|) es mayor que 
0.8. ¿Cuál es la probabilidad de que esto ocurra? 


94 Capítulo 3 Variables aleatorias y distribuciones de probabilidad 


3.31 Con base en pruebas extensas, el fabricante de 
una lavadora determinó que el tiempo Y (en años) para 
que el electrodoméstico requiera una reparación mayor 
se obtiene mediante la siguiente función de densidad de 
probabilidad: 

1 ,-y/4 


10=43 


a) Los críticos considerarían que la lavadora es una 
ganga si no hay probabilidades de que requiera 
una reparación mayor antes del sexto año. Comen- 
te sobre esto determinando P(Y > 6). 

b) ¿Cuál es la probabilidad de que la lavadora requie- 
ra una reparación mayor durante el primer año? 


y >0, 
en cualquier otro caso. 


3.32 Se está revisando qué proporciones de su presu- 
puesto asigna cierta empresa industrial a controles 
ambientales y de contaminación. Un proyecto de reco- 
pilación de datos determina que la distribución de tales 
proporciones está dada por 


5(1—у)%, O<y<l, 
$6) = (1—у) ysi 
0, en cualquier otro caso. 
a) Verifique que la función de densidad anterior sea 


válida. 

b) ¿Cuál es la probabilidad de que una empresa elegi- 
da al azar gaste menos de 10% de su presupuesto 
en controles ambientales y de contaminación? 

c) ¿Cuál es la probabilidad de que una empresa selec- 
cionada al azar gaste más de 50% de su presupues- 
to en controles ambientales y de la contaminación? 


3.33 Suponga que cierto tipo de pequeñas empresas 
de procesamiento de datos están tan especializadas que 
algunas tienen dificultades para obtener utilidades du- 
rante su primer año de operación. La función de densi- 
dad de probabilidad que caracteriza la proporción Y 
que obtiene utilidades está dada por 


a ку(1 = у)?, 0O<y<l, 
Тое |. en otro caso. 

a) ¿Cuál es el valor de k que hace de la anterior una 
función de densidad válida? 

b) Calcule la probabilidad de que al menos 50% de 
las empresas tenga utilidades durante el primer 
año. 

c) Calcule la probabilidad de que al menos 80% de las 
empresas tenga utilidades durante el primer año. 


3.34 Los tubos de magnetrón se producen en una lí- 
nea de ensamble automatizada. Periódicamente se uti- 
liza un plan de muestreo para evaluar la calidad en la 
longitud de los tubos; sin embargo, dicha medida está 
sujeta a incertidumbre. Se considera que la probabili- 
dad de que un tubo elegido al azar cumpla con las espe- 
cificaciones de longitud es 0.99. Se utiliza un plan de 
muestreo en el cual se mide la longitud de 5 tubos ele- 
gidos al azar. 

a) Muestre que la función de probabilidad de Y, el 
número de tubos de cada 5 que cumplen con las 
especificaciones de longitud, está dada por la si- 
guiente función de probabilidad discreta: 


5! y S- y 

FO) = з —уу 09%” 000, 

b) Suponga que se eligen artículos de la línea al azar 
y 3 no cumplen con las especificaciones. Utilice la 
ЈО) anterior para apoyar o refutar la conjetura de 
que hay 0.99 de probabilidades de que un solo 
tubo cumpla con las especificaciones. 


3.35 Suponga que a partir de gran cantidad de datos 
históricos se sabe que X, el número de automóviles que 
llegan a una intersección específica durante un periodo 
de 20 segundos, se determina mediante la siguiente 
función de probabilidad discreta 


FQ)= 25 Е рага х= 0, 1, 2,.... 

a) Calcule la probabilidad de que en un periodo еѕре- 
cífico de 20 segundos más de 8 automóviles lle- 
guen a la intersección. 

b) Calcule la probabilidad de que sólo lleguen 2 auto- 
móviles. 


3.36 En una tarea de laboratorio, si el equipo está 
funcionando, la función de densidad del resultado ob- 
servado, X, es 


ы] FA 


a) Calcule P(X < 1/3). 

b) ¿Cuál es la probabilidad de que X sea mayor que 
0.5? 

с) Dado que X > 0.5, ¿cuál es la probabilidad de que X 
sea menor que 0.75? 


0O<x<l, 
en otro caso. 


3.4 Distribuciones de probabilidad conjunta 


El estudio de las variables aleatorias y sus distribuciones de probabilidad de la sección 
anterior se restringió a espacios muestrales unidimensionales, ya que registramos los 
resultados de un experimento como los valores que toma una sola variable aleatoria. No 
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Definición 3.8: 


obstante, habrá situaciones en las que se busque registrar los resultados simultáneos de 
diversas variables aleatorias. Por ejemplo, en un experimento químico controlado podría- 
mos medir la cantidad del precipitado P y la del volumen V de gas liberado, lo que daría 
lugar a un espacio muestral bidimensional que consta de los resultados (p, v); o bien, 
podríamos interesarnos en la dureza d y en la resistencia a la tensión T de cobre estirado 
en frío que produciría los resultados (d, t). En un estudio realizado con estudiantes univer- 
sitarios para determinar la probabilidad de que tengan éxito en la universidad, basado en 
los datos del nivel preparatoria, se podría utilizar un espacio muestral tridimensional y 
registrar la calificación que obtuvo cada uno en la prueba de aptitudes, el lugar que cada 
uno ocupó en la preparatoria y la calificación promedio que cada uno obtuvo al final de 
su primer año en la universidad. 

Si X y Y son dos variables aleatorias discretas, la distribución de probabilidad рага sus 
ocurrencias simultáneas se representa mediante una función con valores f(x, y), para cual- 
quier par de valores (x, y) dentro del rango de las variables aleatorias X y Y. Se acostumbra 
referirse a esta función como la distribución de probabilidad conjunta de X y Y. 

Por consiguiente, en el caso discreto, 


Р(х, у) = Р(Х =x, Y =y); 


es decir, los valores f(x, у) dan la probabilidad de que los resultados х y y ocurran al 
mismo tiempo. Por ejemplo, si se le va a dar servicio a los neumáticos de un camión de 
transporte pesado, y X representa el número de millas que éstos han recorrido y Y el 
número de neumáticos que deben ser reemplazados, entonces £(30,000, 5) es la probabi- 
lidad de que los neumáticos hayan recorrido más de 30,000 millas y que el camión nece- 
site 5 neumáticos nuevos. 


La función f(x,y) es una distribución de probabilidad conjunta o función de masa de 
probabilidad de las variables aleatorias discretas X y Y, si 


1. f(x, y) > 0 para toda (x, y), 


а 2С еу) =/ 65 y) 


Para cualquier región A en el plano xy, P[(X, Y) €A] = 22f(x,y). 


Ejemplo 3.14: | Se seleccionan al azar 2 repuestos para bolígrafo de una caja que contiene 3 repuestos 


Solución: 


azules, 2 rojos y 3 verdes. Si X es el número de repuestos azules y Y es el número de 
repuestos rojos seleccionados, calcule 


а) la función de probabilidad conjunta f(x, y), 
b) P[(X, Y) € A], donde A es la región {(х, y)|x + y < 1}. 
Los posibles pares de valores (x, y) son (0, 0), (0, 1), (1, 0), (1, 1), (0, 2) y (2, 0). 


a) Ahora bien, £(0, 1), por ejemplo, representa la probabilidad de seleccionar un repues- 
to rojo y uno verde. El número total de formas igualmente probables de seleccionar 
cualesquiera 2 repuestos de los 8 es (8) = 28. El número de formas de seleccio- 
nar 1 rojo de 2 repuestos rojos y 1 verde de 3 repuestos verdes es (2) G) = 6. En 
consecuencia, f(0, 1) = 6/28 = 3/14. Cálculos similares dan las probabilidades para 
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los otros casos, los cuales se presentan en la tabla 3.1. Observe que las probabilidades 
suman 1. En el capítulo 5 se volverá evidente que la distribución de probabilidad 
conjunta de la tabla 3.1 se puede representar con la fórmula 


ley) 
(0) 
рагах = 0, 1, 2; у = 0, 1, 2; у0<х+ух< 2. 

Б) La probabilidad de que (Х,У) caiga en la región A es 


Fx, y) = 


Р|(Х, Y) ЄА]= Р(Х +Y <1)=/(0,0)+/(0,1)+/ (1,0) 
3 3 9 9 


Tabla 3.1: Distribución de probabilidad conjunta para el ejemplo 3.14 


х Totales 
fœ y) O 1 2 [porrenglón 
0 зэ э 2 15 
В 2 28 28 
1 
2 җ 0 0 Е 
Totales por columna E — 1 


Cuando X y Y son variables aleatorias continuas, la función de densidad conjunta 
f(x,y) es una superficie que yace sobre el plano xy, y P[(X,Y) Є A], donde A es cualquier 
región en el plano xy, que es igual al volumen del cilindro recto limitado por la base A y 
la superficie. 


Definición 3.9: La función f(x,y) es una función de densidad conjunta de las variables aleatorias con- 
tinuas X y Y si 


1. f (x y) > 0, para toda (х, y), 
2. JE || ES УУ ass бду ll, 


3. PIX, Y) EA] = f fi fœ y) dx dy, para cualquier región А en el plano xy. 


Ejemplo 3.15: Una empresa privada opera un local que da servicio a clientes que llegan en automóvil y 
otro que da servicio a clientes que llegan caminando. En un día elegido al azar, sean X 
y Y respectivamente, las proporciones de tiempo que ambos locales están en servicio, y 
suponiendo que la función de densidad conjunta de estas variables aleatorias es 


2(2x + 3у), 0<х<1,0<у<1, 


0, en otro caso. 


г) 


a) Verifique la condición 2 de Іа definición 3.9. 
b) Calcule P [(X, Y) E€ A], donde A = {(x, у) 10 <х < 5,1 <y< 5}. 
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Solución: a) La integración de f(x,y) sobre la totalidad de la región es 
со оо 1 pl 2 
/ / f(x у) dx dy - | | ¿Ox + 3y) dx dy 
Бава o Jo 
1 2 х=1 
2x Óxy 
= — == d 
f ( 5 ш 5 ) х=0 á 
-f m л Е РТ 
Аз 5/7 Мз эур 557 
b) Para calcular la probabilidad utilizamos 
P[(X Y) €EA]=P |0<X 21 Leyal 
| Е 224 2 
1/2 112) 
= / ] —(2х + 3y) dx dy 
ма Jo 5 
1/2 2 x=1/2 1/2 
2х? бху ) / ( 1 z) 
= = t dy = = + = | ау 
3 | 5 5 )ls=0 ма MÍO 5 
3 2 1/2 
- (2 + У) 
10 10у 
2..1 1 EN 3 1 : 3 _ 13 
10 |12 4 4 16)| 160 J 


Dada la distribución de probabilidad conjunta f(x,y) de las variables aleatorias dis- 
cretas X y Y, la distribución de probabilidad g(x) sólo de X se obtiene sumando f(x, y) 
sobre los valores de Y. De manera similar, la distribución de probabilidad A(y) de sólo Y 
se obtiene sumando f(x, y) sobre los valores de X. Definimos g(x) y Л(у) como distribu- 
ciones marginales de X y Y, respectivamente. Cuando X y Y son variables aleatorias 
continuas, las sumatorias se reemplazan por integrales. Ahora podemos establecer la si- 


guiente definición general. 


Definición 3.10: Las distribuciones marginales sólo de X y sólo de Y son 


в(х) = У sæ y) ао 


рага el caso discreto, y 


w= | randy по) | suya 


para el caso continuo. 


El término marginal se utiliza aquí porque, en el caso discreto, los valores de g(x) y Л(у) 
son precisamente los totales marginales de las columnas y los renglones respectivos, 
cuando los valores de f(x, y) se muestran en una tabla rectangular. 
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Ejemplo 3.16: | Muestre que los totales de columnas y renglones de la tabla 3.1 dan las distribuciones 
marginales de sólo X y sólo Y. 
Solución: Para la variable aleatoria X vemos que 


3 3 1 5 
80) =F (0,0) 70,1) +70,2) = = aa 12 
9 3 15 
801) = (1,0) +f,1)+f 0,2) = A 2+0 = 55, 


3 3 
80) =f 2,0) +f 2,1) +f 2,2) = = +0+0= с, 
28 28 
que son precisamente los totales por columna de la tabla 3.1. De manera similar po- 
demos mostrar que los valores de Л(у) están dados por los totales de los renglones. En 
forma tabular, estas distribuciones marginales se pueden escribir como sigue: 


x |o 1 2 y |0 1 2 3 
отв ЮЕ? Ж 
Ejemplo 3.17: | Calcule g(x) y h(y) para la función de densidad conjunta del ejemplo 3.15. 
Solución: Por definición, 
оо 1 2 у=1 
2 4ху бу 4х +3 
= [лофе | zara = (Pr) = ES 
Е: о 5 5 10 уо 5 
рага 0 < x < 1, y g(x) = 0 en otro caso. De manera similar, 
оо 1 
2 2(1+3 
м) = | /®уу&= | Ох +зу) d = 32, 
—00 0 5 5 
para 0 < y < 1, y Л(у) = 0 en otro caso. J 


El hecho de que las distribuciones marginales g(x) y Л(у) sean en realidad las distri- 
buciones de probabilidad de las variables individuales X y Y solas se puede verificar 
mostrando que se satisfacen las condiciones de la definición 3.4 o de la definición 3.6. 
Por ejemplo, en el caso continuo 


/ o d= f | f(x, у) dy dx =1, 


P(a< X< b)=P(a<X< b,—œ <Y < оо) 


b оо b 
= | | ®»®а&= | go a. 


En la sección 3.1 establecimos que el valor x de la variable aleatoria X representa un 
evento que es un subconjunto del espacio muestral. Si utilizamos la definición de proba- 
bilidad condicional que se estableció en el capítulo 2, 


P(A AB) 


PEI) == 


, siempre que P(A) > 0, 
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Definición 3.11: 


donde A y В son ahora los eventos definidos por X = x y Y = y, respectivamente, entonces, 


Р(Х =x, Y =y) _ fœ y) 
P(X =x) g(x) 


P(Y =y |X =x)= , siempre que g(x) > 0, 
donde X y Y son variables aleatorias discretas. 

No es difícil mostrar que la función f(x, y)/ g(x), que es estrictamente una función de 
y con x fija, satisface todas las condiciones de una distribución de probabilidad. Esto 
también es cierto cuando f(x, y) y g(x) son la densidad conjunta y la distribución marginal, 
respectivamente, de variables aleatorias continuas. Como resultado, para poder calcular 
probabilidades condicionales de manera eficaz es sumamente importante que utilicemos 
el tipo especial de distribución de la forma f(x, y)/g(x). Este tipo de distribución se llama 
distribución de probabilidad condicional y se define formalmente como sigue: 


Sean X y Y dos variables aleatorias, discretas o continuas. La distribución condicional 
de la variable aleatoria Y, dado que X = x, es 


ES у) 
g(x) 


Л Ох) = 


‚ Siempre que g(x) > 0. 


De manera similar, la distribución condicional de la variable aleatoria X, dado que Y = y, es 


ES 


Роу) = 20) 


, Siempre que Л(у) > 0. 


Si deseamos encontrar la probabilidad de que la variable aleatoria discreta X caiga entre 
a y b cuando sabemos que la variable discreta Y = y, evaluamos 


Р(а<Х<Ь|Ү =у) = Y fly, 


a<x<b 


donde la sumatoria se extiende a todos los valores de X entre a y b. Cuando X y Y son 
continuas, evaluamos 


b 
Р(а<Х < bIY =у)= | FOD) а 


Ejemplo 3.18: | Remítase al ejemplo 3.14, calcule la distribución condicional de X, dado que Y = 1, y 


Solución: 


utilice el resultado para determinar P(X = 0| Y = 1). 
Necesitamos encontrar f(x | y), donde у = 1. Primero calculamos que 


2 
3 3 
к0= 70 = atar 


Ahora calculamos, 


7 
3 


_ 7% 1) _ 
ор => =( 


)ra 1), x=0,1,2. 
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Por lo tanto, 


7 7 3 1 7 7 3 1 
паре (3)ле (5) (а) ла (3) оо (5) (5) == 


7 7 
feID= Ge D= (3) (0) =0, 


y la distribución condicional de X, dado que Y = 1, es 
x |0 2 
ғо |4 0 


Finalmente, 1 
Р(Х =0|Y =D = 011) = 5` 


юкер 


Por lo tanto, si se sabe que 1 de los 2 repuestos seleccionados es rojo, tenemos una pro- 
babilidad igual a 1/2 de que el otro repuesto no sea azul. JJ 


Ejemplo 3.19: | Га densidad conjunta para las variables aleatorias (X,Y), donde X es el cambio unitario 


de temperatura y Y es la proporción de desplazamiento espectral que produce cierta par- 
tícula atómica es 

10xy?, O<x<y<l, 

0, en otro caso. 


fœ y) = | 
a) Calcule las densidades marginales g(x), Л(у) у la densidad condicional f(y | x). 


b) Calcule la probabilidad de que el espectro se desplace más de la mitad de las obser- 
vaciones totales, dado que la temperatura se incremente en 0.25 unidades. 


Solución: a) Por definición, 
оо 1 
w= | лаф = | 10d 


у=1 
1 
— а —х%),0<х<1, 


10 
= y 


3 


у=х 
e y х=у 

һ(у) = / f(x, y) dx =/ 10ху? dx = 5х?у*| E 5у*, 0<y<1. 
—оо 0 


Entonces, 


(х,у) 10ху? 3y? 


go) a) 1=x 


z: 0<x<y<l. 


fol =! 


b) Por lo tanto, 


pP(rY>2|x=025 = f so] -0254 = f o ga 
2 ңы Е 1/2 и Аш 1/2 1 — 0.253 79 y 


Ejemplo 3.20: | Dada la función de densidad conjunta 


tD SN 


0, en otro caso, 


гәт 


calcule g(x), hO), f(x] y) y evalúe P(F <Х< 3 | Y = 1). 
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Solución: Por definición de la densidad marginal, para 0 < x < 2, 


оо 1 2 
в) | sanos | Ha 


ху gyp 
a tato 
a 


со 2 2 
ros | ranas [Ea 
—оо 0 


Y AREA 
(E 
8 8 


Por lo tanto, usando la definición de la densidad condicional para O < x < 2, 


NIS 


y=0 


урага0 < у < 1, 


_ 1+3у? 
= 


x=0 


Ду)  x(1+3y2)/4 x 


Му (1+3у2)/2 2/ 


Fly) = 


Independencia estadística 


Si f(x| y) no depende de y, como ocurre en el ejemplo 3.20, entonces f(x|y) = g(x) y 
ЈО, у) = g609h(y). La prueba se realiza sustituyendo 


fœ у) =£GA NAO) 


en la distribución marginal de X. Es decir, 


w=] лаф = | FEDO) d 
Si f(x | у) no depende de y, podemos escribir 
б) гаф) ] во) Ф. 


Entonces, 


/ h) dy = 1, 


уа que h(y) es la función de densidad de probabilidad de Y. Por lo tanto, 


g(x) = f(x|y) y entonces f(x, y) = g(x)h(y). 
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Definición 3.12: 
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Debería tener sentido para el lector que si f(x| y) no depende de y, entonces, por 
supuesto, el resultado de la variable aleatoria Y no repercute en el resultado de la variable 
aleatoria X. En otras palabras, decimos que X y Y son variables aleatorias independien- 
tes. Ofrecemos ahora la siguiente definición formal de independencia estadística. 


Sean X y Y dos variables aleatorias, discretas o continuas, con distribución de probabi- 
lidad conjunta f(x, y) y distribuciones marginales g(x) y A(y), respectivamente. Se dice 
que las variables aleatorias X y Y son estadísticamente independientes si y sólo si 


f(x у) = г(х)Л(у) 


para toda (x,y) dentro de sus rangos. 


Las variables aleatorias continuas del ejemplo 3.20 son estadísticamente indepen- 
dientes, pues el producto de las dos distribuciones marginales da la función de densidad 
conjunta. Sin embargo, es evidente que ése no es el caso de las variables continuas del 
ejemplo 3.19. La comprobación de la independencia estadística de variables aleatorias 
discretas requiere una investigación más profunda, ya que es posible que el producto de 
las distribuciones marginales sea igual a la distribución de probabilidad conjunta para 
algunas, aunque no para todas, las combinaciones de (x,y). Si puede encontrar algún 
punto (x,y) para el que f(x, y) se define de manera que f(x, y) + gG0)h(y), las variables 
discretas X y Y no son estadísticamente independientes. 


Ejemplo 3.21: | Demuestre que las variables aleatorias del ejemplo 3.14 no son estadísticamente inde- 


Prueba: 


pendientes. 
Consideremos el punto (0,1). A partir de la tabla 3.1, encontramos que las tres probabi- 
lidades £(0, 1), 2(0) y Л(1) son 


3 
0, 1) = —, 
F0,D== 
2 
3 3 1 Э 
0 = 0, = == > 
#0) 215 У) = 25 +14 R = 14 
: 33 3 
h(1) = , 1) = 0=:= 
(1) уе pa Т ыа: 
Claramente, 
/ (0,1) # 8(0)/(1), 
por lo tanto, X y Y по son estadísticamente independientes. И | 
Todas las definiciones anteriores respecto a dos variables aleatorias se pueden gene- 
ralizar al caso de n variables aleatorias. Sea FA, Х».++› x,) la función de probabilidad 
conjunta de las variables aleatorias Х|, X,,..., Х,. La distribución marginal de X,, por 
ejemplo, es 


#01) = У-У бо... ха) 


Хп 
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para el caso discreto, y 
аб) | -f F(1,X2,..., Xp) dxa dx3 +++ ах, 


para el caso continuo. Ahora podemos obtener distribuciones marginales conjuntas 
como g(x, x,), donde 


AAA a) (caso discreto), 
g(x1,x2) = х3 Хп 
оо оо . 
= da) ахз ахд ах (caso continuo). 


Podríamos considerar numerosas distribuciones condicionales. Por ejemplo, la distribu- 
ción condicional conjunta de Х|, X, y X,, dado que X, = х,, Х, = х,,..., X, = х,, Se 
escribe como 


Р (х1 Хоа) 
ita la 2, 
2(X4,X5,-..,X 1) 


donde g(x,, х,,..., x,) es la distribución marginal conjunta de las variables aleatorias X,, 
Karassa Aa 
Una generalización de la definición 3.12 nos lleva a la siguiente definición para la 
independencia estadística mutua de las variables Х,, X,,..., Х. 
Definición 3.13: Sean Xp Х,,..., X, п variables aleatorias, discretas o continuas, con distribución de 
probabilidad conjunta f(x,, х,,..., x,) y distribuciones marginales f (x,), (х,),..., f,(%,,), 
respectivamente. Se dice que las variables aleatorias X, X,,..., X, son recíproca y esta- 

dísticamente independientes si y sólo si 


Í(X1,X2, An) = Рб) (хо) + Ў (ха) 


рага toda (x,, х,,...,х,) dentro de sus rangos. 


Ejemplo 3.22: | Suponga que el tiempo de vida en anaquel de cierto producto comestible perecedero 
empacado en cajas de cartón, en años, es una variable aleatoria cuya función de densidad 
de probabilidad está dada por 


As ү ®> 0, 


0, en otro caso. 


Represente los tiempos de vida en anaquel para tres de estas cajas seleccionadas de for- 
ma independiente con Х,, X, y X, y calcule P(X, < 2, 1< X, < 3, X, > 2). 

Solución: Como las cajas se seleccionaron de forma independiente, suponemos que las variables 
aleatorias Х,, X, y X, son estadísticamente independientes y que tienen la siguiente den- 
sidad de probabilidad conjunta: 


Р(х1,х2,х3) = Р(х) (2) (хз) = е ее" = e, 


рагах > 0, х, > 0, х, > 0, y f(x, х,, х,) = О en cualquier otro caso. En consecuencia, 


“со 3 2 
Р(Х <21<X2<3X3>D)=/ ] / е 51752753 dyi dxs ӣхз 
2 1 0 


=(1-e ?Xe7! —e73e7? = 0.0372. y 
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¿Por qué son importantes las características de las distribuciones 
de probabilidad y de dónde provienen? 


Ejercicios 


Es importante que este texto ofrezca al lector una transición hacia los siguientes tres ca- 
pítulos. En los ejemplos y los ejercicios presentamos casos de situaciones prácticas de 
ingeniería y ciencias, en los cuales las distribuciones de probabilidad y sus propiedades 
se utilizan para resolver problemas importantes. Estas distribuciones de probabilidad, ya 
sean discretas o continuas, se presentaron mediante frases como “se sabe que”, “suponga 
que” o incluso, en ciertos casos, “la evidencia histórica sugiere que”. Se trata de situacio- 
nes en las que la naturaleza de la distribución, e incluso una estimación óptima de la es- 
tructura de la probabilidad, se pueden determinar utilizando datos históricos, datos toma- 
dos de estudios a largo plazo o incluso de grandes cantidades de datos planeados. El 
lector debería tener presente lo expuesto en el capítulo 1 respecto al uso de histogramas 
y, por consiguiente, recordar cómo se estiman las distribuciones de frecuencias a partir 
de los histogramas. Sin embargo, no todas las funciones de probabilidad y de densidad de 
probabilidad se derivan de cantidades grandes de datos históricos. Hay un gran número 
de situaciones en las que la naturaleza del escenario científico sugiere un tipo de distribu- 
ción. De hecho, varias de ellas se reflejan en los ejercicios del capítulo 2 y en este capítulo. 
Cuando observaciones repetidas independientes son binarias por naturaleza (es decir, 
defectuoso o no, funciona o no, alérgico o no) con un valor de 0 o 1, la distribución que 
cubre esta situación se llama distribución binomial. La función de probabilidad de esta 
distribución se explicará y se demostrará en el capítulo 5. El ejercicio 3.34 de la sección 3.3 
y el ejercicio de repaso 3.80 constituyen ejemplos de este tipo de distribución, y hay otros 
que el lector también debería reconocer. El escenario de una distribución continua del 
tiempo de operación antes de cualquier falla, como en el ejercicio de repaso 3.69 o en el 
ejercicio 3.27 de la página 93, a menudo sugiere una clase de distribución denominada 
distribución exponencial. Tales tipos de ejemplos son tan sólo dos de la gran cantidad 
de las llamadas distribuciones estándar que se utilizan ampliamente en situaciones del 
mundo real porque el escenario científico que da lugar a cada uno de ellos es reconocible 
y a menudo se presenta en la práctica. Los capítulos 5 y 6 abarcan muchos de estos tipos 
de ejemplos, junto con alguna teoría inherente respecto de su uso. 

La segunda parte de esta transición al material de los capítulos siguientes tiene que 
ver con el concepto de parámetros de la población o parámetros de distribución. 
Recuerde que en el capítulo 1 analizamos la necesidad de utilizar datos para ofrecer in- 
formación sobre dichos parámetros. Profundizamos en el estudio de las nociones de 
media y de varianza, y proporcionamos ideas sobre esos conceptos en el contexto de una 
población. De hecho, es fácil calcular la media y la varianza de la población a partir de 
la función de probabilidad para el caso discreto, o de la función de densidad de probabi- 
lidad para el caso continuo. Tales parámetros y su importancia en la solución de muchas 
clases de problemas de la vida real nos proporcionarán gran parte del material de los 
capítulos 8 a 17. 


3.37 Determine los valores de с, tales que las siguien- 3.38 Si la distribución de probabilidad conjunta de X 
tes funciones representen distribuciones de probabili- у Y está dada por 
dad conjunta de las variables aleatorias X y Y: x+y 


а) f(x, y) = сху, para x = 1, 2, 3; y = 1, 2, 3; 
b) fœ, y) =clx— у 


Ax у) = 50° para х = 0, 1, 2,3; y = 0,1,2, 


, para x = —2, 0, 2; у = —2, 3. calcule 


Ejercicios 


а) Р(Х <2Y =1); 

b) P(X > 2Y 21); 

с) Р(Х > Ү); 

d) P(X +Y =4). 
3.39 De un saco de frutas que contiene 3 naranjas, 2 
manzanas y 3 plátanos se selecciona una muestra alea- 
toria de 4 frutas. Si X es el número de naranjas y Y el de 
manzanas en la muestra, calcule 

a) la distribución de probabilidad conjunta de X y Y; 
b) P[(X, Y) Є А], donde A es la región dada por 
{œx +y < 2}. 


3.40 Un restaurante de comida rápida opera tanto en 
un local que da servicio en el automóvil, como en un 
local que atiende a los clientes que llegan caminando. 
En un día elegido al azar, represente las proporciones 
de tiempo que el primero y el segundo local están en 
servicio con X y Y, respectivamente, y suponga que la 
función de densidad conjunta de estas variables aleato- 
rias es 


2 
50+), 0<x<1,0<y<l, 
2} 3 
fœ у) = |, еп otro caso. 


a) Calcule la densidad marginal de X. 

b) Calcule la densidad marginal de Y. 

c) Calcule la probabilidad de que el local que da ser- 
vicio a los clientes que llegan en automóvil esté 
lleno menos de la mitad del tiempo. 


3.41 Una empresa dulcera distribuye cajas de choco- 
lates con un surtido de cremas, chiclosos y envinados. 
Suponga que cada caja pesa 1 kilogramo, pero que los 
pesos individuales de cremas, chiclosos y envinados 
varían de una a otra cajas. Para una caja seleccionada al 
azar, represente los pesos de las cremas y los chiclosos 
con X y Y, respectivamente, y suponga que la función 
de densidad conjunta de estas variables es 


24xy, O<x<l,0<y<lx+y<l, 
0, en cualquier caso. 


FG »= { 


а) Calcule la probabilidad de que en una caja dada los 
envinados representen más de la mitad del peso. 

b) Calcule la densidad marginal para el peso de las 
cremas. 

c) Calcule la probabilidad de que el peso de los chi- 
closos en una caja sea menor que 1/8 de kilogra- 
mo, si se sabe que las cremas constituyen 3/4 
partes del peso. 


3.42 Sean X y Y la duración de la vida, en años, de 
dos componentes en un sistema electrónico. Si la fun- 
ción de densidad conjunta de estas variables es 

e” (х+у) Г 


ғо) = {6 x>0, y >0, 


en otro caso, 
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calcule P(0 < X < 1 | Y= 2). 


3.43 Sea X el tiempo de reacción, en segundos, ante 
cierto estímulo, y Y la temperatura (en °Е) a la cual 
inicia cierta reacción. Suponga que dos variales aleato- 
rias, X y Y, tienen la densidad conjunta 


_ fy, 0<x<1,0<y<l, 
fœ y) = || en otro caso. 
Calcule 
a) PO<X <} y ¿SY <p 
b) Р(Х < Y). * 


3.44 Se supone que cada rueda trasera de un avión 
experimental se llena a una presión de 40 libras por 
pulgada cuadrada (psi). Sea X la presión real del aire 
para la rueda derecha y Y la presión real del aire de la 
rueda izquierda. Suponga que X y Y son variables alea- 
torias con la siguiente función de densidad conjunta: 


k(x? +y?), 30<x< 50, 30 < y < 50, 
о, у) = {0 
; en otro caso. 
a) Calcule k. 
b) Calcule P(30 < X < 40 y 40 < Y < 50). 
c) Calcule la probabilidad de que ambas ruedas no 
contengan la suficiente cantidad de aire. 


3.45 Sea X el diámetro de un cable eléctrico blindado 
y Y el diámetro del molde cerámico que hace el cable. 
Tanto X como Y tienen una escala tal que están entre 0 
y 1. Suponga que X y Y tienen la siguiente densidad 
conjunta: 


L, O<x<y<l, 


FG у) = К 


Calcule P(X + Y > 1/2). 


en otro caso. 


3.46 Remítase al ejercicio 3.38, calcule 
a) la distribución marginal de X; 
b) la distribución marginal de Y. 


3.47 Al principio de cualquier día la cantidad de que- 
roseno que contiene un tanque, en miles de litros, es una 
cantidad aleatoria Y, de la que durante el día se vende 
una cantidad aleatoria X. Suponga que el tanque no se 
reabastece durante el día, de manera que x < y, e ima- 
gine también que la función de densidad conjunta de 
estas variables es 


2, O<x<y<l, 
0, en otro caso. 


fx, y) ={ 


a) Determine si X y Y son independientes. 
b) Calcule P(1/4 < X < 1/2| Y =3/4). 
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3.48 Remítase al ejercicio 3.39 y calcule 
a) }(у|2) para todos los valores de y; 
b) Р(Ү= 0|Х = 2). 


3.49 Sea X el número de veces que fallará cierta má- 
quina de control numérico: 1, 2 o 3 veces en un día 
dado. Y si Y denota el número de veces que se llama a 
un técnico para una emergencia, su distribución de pro- 
babilidad conjunta estará dada como 


X 
f(x,y) 1 2 3 
1 0.05 0.05 0.10 
y 3 0.05 0.10 0.35 
5 0.00 0.20 0.10 


a) Evalúe la distribución marginal de X. 
b) Evalúe la distribución marginal de Y. 
c) Calcule P(Y = 3 | X = 2). 


3.50 Suponga que X y Y tienen la siguiente distribu- 
ción de probabilidad conjunta: 


х 
оу) [| 2 4 
1 (0.10 0.15 
y 3 | 0.20 0.30 
5 [010 0.15 


a) Calcule la distribución marginal de Х. 
b) Calcule la distribución marginal de Y. 


3.51 De las 12 cartas mayores (jotas, reinas y reyes) 
de una baraja ordinaria de 52 cartas se sacan tres cartas 
sin reemplazo. Sea X el número de reyes que se selec- 
cionan y Y el número de jotas. Calcule 
а) la distribución de probabilidad conjunta de X y У; 
b) P[(X,Y) € A], donde A es la región dada por 
{œx +y > 2). 


3.52 Una moneda se lanza dos veces. Sea Z el núme- 
ro de caras en el primer lanzamiento y W el número 
total de caras en los 2 lanzamientos. Si la moneda no 
está balanceada y una cara tiene una probabilidad de 
ocurrencia de 40%, calcule 

a) la distribución de probabilidad conjunta de W y Z; 
b) la distribución marginal de №; 

c) la distribución marginal de Z; 

d) la probabilidad de que ocurra al menos 1 cara. 
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3.53 Dada la función de densidad conjunta 


22, 0<x<2,2<y<14, 


f(x у) = | en otro caso, 


calcule P(1 < Y < 3|X = 1). 


3.54 Determine si las dos variables aleatorias del 
ejercicio 3.49 son dependientes o independientes. 


3.55 Determine si las dos variables aleatorias del 
ejercicio 3.50 son dependientes o independientes. 


3.56 La función de densidad conjunta de las variables 
aleatorias X y Y es 


_$f6x, O<x<1!l,0<y<l=x, 
Оу) = [о en otro caso. 


a) Demuestre que X y Y no son independientes. 
b) Calcule Р(Х > 0.3| Y = 0.5). 


3.57 851 X, Y y Z tienen la siguiente función de densi- 
dad de probabilidad conjunta: 


kxy?z, 


1 2 
tæ» = {0 0<x,y <1, 0<z<2, 


en otro caso. 


a) Calcule К. 
b) Calcule P(X < 4 Y >4,1 < Z< 2). 


3.58 Determine si las dos variables aleatorias del 
ejercicio 3.43 son dependientes o independientes. 


3.59 Determine si las dos variables aleatorias del 
ejercicio 3.44 son dependientes o independientes. 


3.60 La función de densidad de probabilidad conjun- 
ta de las variables aleatorias X, Y y Z es 


4xyz? 
о 0<xy<1,0<z2<3, 
х,у„2)= 9 
Jy) en otro caso. 


Calcule 
a) la función de densidad marginal conjunta de Y y Z; 
b) la densidad marginal de Y; 

с) Р(1<Х<,Ү»>»,1<7<2); 


d) Р0О<Х<Ь|уУ=1,7=2). 


Ejercicios de repaso 


Ejercicios de repaso 


3.61 Una empresa tabacalera produce mezclas de ta- 
baco. Cada mezcla contiene diversas proporciones de 
tabaco turco, tabaco de la región y otros. Las propor- 
ciones de tabaco turco y de la región en una mezcla son 
variables aleatorias con una función de densidad con- 
junta (X = turco y Y = de la región) 


_ Ј24ху, O0<x,y<l,x+ys<l, 
Fx, y) = || en otro caso. 


a) Calcule la probabilidad de que en determinada 
caja el tabaco turco represente más de la mitad de 
la mezcla. 

b) Calcule la función de densidad marginal para la 
proporción del tabaco de la región. 

c) Calcule la probabilidad de que la proporción de 
tabaco turco sea menor que 1/8, si se sabe que la 
mezcla contiene 3/4 de tabaco de la región. 


3.62 Una empresa de seguros ofrece a sus asegurados 
varias opciones diferentes de pago de la prima. Para un 
asegurado seleccionado al azar, sea X el número de me- 
ses entre pagos sucesivos. La función de distribución 
acumulada de X es 


0, six<l, 
0.4, sil <x < 3, 
F(x) =4 0.6,si3 <х < 5, 
0.8, 515 <х <7, 
1.0, six 27. 
a) ¿Cuál es la función de masa de probabilidad de X? 
b) Calcule P(4 < X < 7). 


3.63 Dos componentes electrónicos de un sistema de 
proyectiles funcionan en conjunto para el éxito de todo 
el sistema. Sean X y Y la vida en horas de los dos com- 
ponentes. La densidad conjunta de X y Y es 


=y (l +x) 
> 


jans ее куто 


0, en otro caso. 


a) Determine las funciones de densidad marginal 
para ambas variables aleatorias. 

b) ¿Cuál es la probabilidad de que ambos componen- 
tes duren más de dos horas? 


3.64 Una instalación de servicio opera con dos líneas 
telefónicas. En un día elegido al azar, sea X la propor- 
ción de tiempo que la primera línea está en uso, mien- 
tras que Y es la proporción de tiempo en que la segunda 
línea está en uso. Suponga que la función de densidad 
de probabilidad conjunta para (X, Y) es 


(х2 +y), 0O<xy<l, 
0, en otro caso. 


/®»={ 
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a) Calcule la probabilidad de que ninguna línea esté 
ocupada más de la mitad del tiempo. 

b) Calcule la probabilidad de que la primera línea 
esté ocupada más del 75% del tiempo. 


3.65 беа el número de llamadas telefónicas que reci- 
be un conmutador durante un intervalo de 5 minutos 
una variable aleatoria X con la siguiente función de 
probabilidad: 


-2nx 

Fx) = = para x=0,1,2,.... 

a) Determine la probabilidad de que X sea igual a 0, 
1,2,3,4,5 y 6. 

b) Grafique la función de masa de probabilidad para 
estos valores de x. 

c) Determine la función de distribución acumulada 
para estos valores de X. 


3.66 Considere las variables aleatorias X y Y con la 
siguiente función de densidad conjunta 


0O=<xy<l, 
en cualquier otro caso. 


FG y) = ак 


а) Calcule las distribuciones marginales de X у Y. 
b) Calcule P(X > 0.5, Y > 0.5). 


3.67 Еп un proceso industrial se elaboran artícu- 
los que se pueden clasificar como defectuosos o no de- 
fectuosos. La probabilidad de que un artículo esté 
defectuoso es 0.1. Se realiza un experimento en el que 5 
artículos del proceso se eligen al azar. Sea la variable 
aleatoria X el número de artículos defectuosos en esta 
muestra de 5. ¿Cuál es la función de masa de probabili- 
dad de X? 


3.68 Considere la siguiente función de densidad de 
probabilidad conjunta de las variables aleatorias X y Y: 


3x—y 


1<х<3, 1<у<2 
E 5 ‚ ) Я 
fœ у) lo en otro caso. 


a) Calcule las funciones de densidad marginal de X y Y. 
b) ¿X y Y son independientes? 
c) Calcule Р(Х > 2). 


3.69 La duración en horas de un componente eléctri- 
co es una variable aleatoria con la siguiente función de 
distribución acumulada: 


X 


1—е 50, x>0, 


0, en otro caso. 


ғо) =} 
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a) Determine su función de densidad de probabilidad. 
b) Determine la probabilidad de que la vida útil de tal 
componente rebase las 70 horas. 


3.70 Еп una fábrica específica de pantalones un gru- 
po de 10 trabajadores los inspecciona tomando aleato- 
riamente algunos de la línea de producción. A cada 
inspector se le asigna un número del 1 al 10. Un com- 
prador selecciona un pantalón para adquirirlo. Sea la 
variable aleatoria X el número del inspector. 
a) Determine una función de masa de probabilidad 
razonable para X. 
b) Grafique la función de distribución acumulada 
para X. 


3.71 La vida en anaquel de un producto es una varia- 
ble aleatoria que se relaciona con la aceptación por par- 
te del consumidor. Resulta que la vida en anaquel Y, en 
días, de cierta clase de artículo de panadería tiene la 
siguiente función de densidad: 


12702. 


ғо= {0 


¿Qué fracción de las rebanadas de este producto que 
hoy están en exhibición se espera que se vendan en 3 
días a partir de hoy? 


0<y<oo, 
en otro caso. 


3.72 El congestionamiento de pasajeros es un proble- 
ma de servicio en los aeropuertos, en los cuales se ins- 
talan trenes para reducir la congestión. Cuando se usa 
el tren, el tiempo X, en minutos, que toma viajar desde 
la terminal principal hasta una explanada específica tie- 
ne la siguiente función de densidad: 


+, 0O<x<l0 
гу = 1 10° = 
¿> t en otro caso. 
a) Demuestre que la función de densidad de probabi- 
lidad anterior es válida. 
b) Calcule la probabilidad de que el tiempo que le 
toma a un pasajero viajar desde la terminal princi- 
pal hasta la explanada no exceda los 7 minutos. 


3.73 Las impurezas en el lote del producto final de un 
proceso químico a menudo reflejan un grave problema. 
A partir de una cantidad considerable de datos recaba- 
dos en la planta se sabe que la proporción Y de impure- 
zas en un lote tiene una función de densidad dada por 


10 — y)», O<y<l, 
еы ll lt 
0, en cualquier otro caso. 
a) Verifique que la función de densidad anterior sea 


válida. 

b) Se considera que un lote no es vendible y, por con- 
siguiente, no es aceptable si el porcentaje de impu- 
rezas es superior a 60%. Con la calidad del proceso 
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actual, ¿cuál es el porcentaje de lotes que no son 
aceptables? 


3.74 El tiempo Z, en minutos, entre llamadas a un sis- 
tema de alimentación eléctrica tiene la siguiente fun- 
ción de densidad de probabilidad: 


1 2—10 


=e , 0<z< œ, 


en otro caso. 


a) ¿Cuál es la probabilidad de que no haya llamadas 
en un lapso de 20 minutos? 

b) ¿Cuál es la probabilidad de que la primera llamada 
entre en los primeros 10 minutos después de abrir? 


3.75 Un sistema químico que surge de una reacción 
química tiene dos componentes importantes, entre 
otros, en una mezcla. La distribución conjunta que des- 
cribe las proporciones X, y X, de estos dos componen- 
tes está dada por 


2, О< х < <1, 
/(х1,хә) = 
0, en otro caso. 


а) Determine la distribución marginal de X.. 

b) Determine la distribución marginal de X,. 

c) ¿Cuál es la probabilidad de que las proporciones 
del componente generen los resultados X, < 0.2 y 
X, > 0.5? 

d) Determine la distribución condicional Fx 0, | a): 


3.76 Considere la situación del ejercicio de repaso 
3.75; pero suponga que la distribución conjunta de las 
dos proporciones está dada por 


6x2, О< ж < <1, 
0, en otro caso. 


1x2) =4 


a) Determine la distribución marginal fx (х,) de la 
proporción X, y verifique que sea una función de 
densidad válida. 

b) ¿Cuál es la probabilidad de que la proporción X, 
sea menor que 0.5, dado que X, es 0.7? - 


3.77 Considere las variables aleatorias X y Y que re- 
presentan el número de vehículos que llegan a dos es- 
quinas de calles separadas durante cierto periodo de 2 
minutos. Estas esquinas de las calles están bastante cer- 
ca una de la otra, así que es importante que los ingenie- 
ros de tráfico se ocupen de ellas de manera conjunta si 
fuera necesario. Se sabe que la distribución conjunta 
de X y Yes 


9 1 
fœ y) = 16 40 о)? 
parax=0,1,2,..., y para y = 0, 1, 2,... 


a) ¿Son independientes las dos variables aleatorias X 
y Y? Explique su respuesta. 
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b) ¿Cuál es la probabilidad de que, durante el periodo 
en cuestión, lleguen menos de 4 vehículos a las 
dos esquinas? 


3.78 El comportamiento de series de componentes 
desempeña un papel importante en problemas de con- 
fiabilidad científicos y de ingeniería. Ciertamente la 
confiabilidad de todo el sistema no es mejor que la del 
componente más débil de las series. En un sistema de 
series los componentes funcionan de manera indepen- 
diente unos de otros. En un sistema particular de tres 
componentes, la probabilidad de cumplir con la especi- 
ficación para los componentes 1, 2 y 3, respectivamen- 
te, son 0.95, 0.99 y 0.92. ¿Cuál es la probabilidad de 
que todo el sistema funcione? 


3.79 Otro tipo de sistema que se utiliza en trabajos de 
ingeniería es un grupo de componentes en paralelo o un 
sistema paralelo. En este enfoque más conservador la 
probabilidad de que el sistema funcione es mayor que 
la probabilidad de que cualquier componente funcione. 
El sistema fallará sólo cuando falle todo el sistema. 
Considere una situación en la que hay 4 componentes 


109 


independientes en un sistema paralelo, en la que la pro- 
babilidad de operación está dada por 

Componente 1: 0.95; 
Componente 3: 0.90; 


Componente 2: 0.94; 
Componente 4: 0.97. 


¿Cuál es la probabilidad de que no falle el sistema? 


3.80 Considere un sistema de componentes en que 
hay cinco componentes independientes, cada uno de 
los cuales tiene una probabilidad de operación de 0.92. 
De hecho, el sistema tiene una redundancia preventiva 
diseñada para que no falle mientras 3 de sus 5 compo- 
nentes estén en funcionamiento. ¿Cuál es la probabili- 
dad de que funcione todo el sistema? 


3.81 Proyecto de grupo: Observe el color de los za- 
patos de los estudiantes en 5 periodos de clases. Supon- 
ga que las categorías de color son rojo, blanco, negro, 
café y otro. Construya una tabla de frecuencias para 
cada color. 
a) Estime e interprete el significado de la distribución 
de probabilidad. 
b) ¿Cuál es la probabilidad estimada de que en el si- 
guiente periodo de clases un estudiante elegido al 
azar use un par de zapatos rojos o blancos? 


3.5 Posibles riesgos y errores conceptuales; relación 
con el material de otros capítulos 


En los siguientes capítulos será evidente que las distribuciones de probabilidad represen- 
tan la estructura mediante la cual las probabilidades que se calculan ayudan a evaluar y 
a comprender un proceso. Por ejemplo, en el ejercicio de repaso 3.65 la distribución de 
probabilidad que cuantifica la probabilidad de que haya una carga excesiva durante cier- 
tos periodos podría ser muy útil en la planeación de cualquier cambio en el sistema. El 
ejercicio de repaso 3.69 describe un escenario donde se estudia el periodo de vida útil de 
un componente electrónico. Conocer la estructura de la probabilidad para el componente 
contribuirá de manera significativa al entendimiento de la confiabilidad de un sistema 
mayor del cual éste forme parte. Además, comprender la naturaleza general de las distri- 
buciones de probabilidad reforzará el conocimiento del concepto valor-P, que se estudió 
brevemente en el capítulo 1 y que desempeñará un papel destacado al inicio del capítu- 
lo 10 y en lo que resta del texto. 

Los capítulos 4, 5 y 6 dependen mucho del material cubierto en este capítulo. En el 
capítulo 4 estudiaremos el significado de parámetros importantes en las distribuciones 
de probabilidad. Tales parametros cuantifican las nociones de tendencia central y va- 
riabilidad en un sistema. De hecho, el conocimiento de tales cantidades, al margen de 
la distribución completa, puede ofrecer información sobre la naturaleza del sistema. En 
los capítulos 5 y 6 se examinarán escenarios de ingeniería, biológicos y de ciencia en ge- 
neral que identifican tipos de distribuciones especiales. Por ejemplo, la estructura de la 
función de probabilidad en el ejercicio de repaso 3.65 se identificará fácilmente bajo 
ciertas suposiciones que se estudiarán en el capítulo 5. Lo mismo ocurre en el contexto 
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del ejercicio de repaso 3.69, que es un caso especial de problema sobre tiempo de ope- 
ración antes de la falla, cuya función de densidad de probabilidad se estudiará en el 
capítulo 6. 

En lo que concierne a los riesgos potenciales de utilizar el material de este capítulo, 
la advertencia para el lector sería no interpretar el material más allá de lo que sea eviden- 
te. La naturaleza general de la distribución de probabilidad para un fenómeno científico 
determinado no es obvia a partir de lo que se estudió aquí. La finalidad de este capítulo 
es que los lectores aprendan a manipular una distribución de probabilidad, no que apren- 
dan a identificar un tipo específico. Los capítulos 5 y 6 avanzan un largo trecho hacia la 
identificación de acuerdo con la naturaleza general del sistema científico. 


Capítulo 4 


Esperanza matemática 


4.1 Media de una variable aleatoria 


En el capítulo 1 estudiamos la media muestral, que es la media aritmética de los datos. 
Ahora considere la siguiente situación: si dos monedas se lanzan 16 veces y X es el 
número de caras que resultan en cada lanzamiento, entonces los valores de X pueden 
ser 0, 1 y 2. Suponga que los resultados del experimento son: cero caras, una cara y dos 
caras, un total de 4, 7 y 5 veces, respectivamente. El número promedio de caras por lan- 
zamiento de las dos monedas es, entonces, 


O4) + (DO) + (2)(5) _ 
16 


1.06. 


Éste es un valor promedio de los datos, aunque no es un resultado posible de {0, 1, 2}. 
Por lo tanto, un promedio no es necesariamente un resultado posible del experimen- 
to. Por ejemplo, es probable que el ingreso mensual promedio de un vendedor no sea 
igual a alguno de sus cheques de pago mensuales. 

Reestructuremos ahora nuestro cálculo del número promedio de caras para tener la 
siguiente forma equivalente: 


4 7 5 
(0) (з) + (1) (=) + (2) (55) = 1.06. 


Los números 4/16, 7/16 y 5/16 son las fracciones de los lanzamientos totales que dan 
como resultado 0, 1 y 2 caras, respectivamente. Tales fracciones también son las frecuen- 
cias relativas de los diferentes valores de X en nuestro experimento. Entonces, realmente 
podemos calcular la media, o el promedio de un conjunto de datos, si conocemos los 
distintos valores que ocurren y sus frecuencias relativas sin tener conocimiento del nú- 
mero total de observaciones en el conjunto de datos. Por lo tanto, si 4/16 o 1/4 de los lan- 
zamientos dan como resultado cero caras, 7/16 de los lanzamientos dan como resultado 
una cara y 5/16 dan como resultado dos caras, el número medio de caras por lanzamiento 
sería 1.06, sin importar si el número total de lanzamientos fue 16, 1000 o incluso 10,000. 

Este método de frecuencias relativas se utiliza para calcular el número promedio de 
caras que esperaríamos obtener a largo plazo por el lanzamiento de dos monedas. A este 
valor promedio se le conoce como media de la variable aleatoria X o media de la dis- 
tribución de probabilidad de X, y se le denota como и, o simplemente сото џи cuando 
es evidente a qué variable aleatoria se está haciendo referencia. También es común entre 
los estadísticos referirse a esta media como la esperanza matemática o el valor esperado 
de la variable aleatoria X y denotarla como E(X). 
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Definición 4.1: 


Capítulo 4 Esperanza matemática 


Suponiendo que una moneda legal se lanza dos veces, encontramos que el espacio 
muestral para el experimento es 


S = {HH,HT,TH,TT}. 


Como los 4 puntos muestrales son igualmente probables, se deduce que 


Р(Х = 0) = Р(ТТ) = a P(X=1)=P(TH)+P(HT)= o 


Р(Х = 2) = Р(НН) = > 


donde un elemento típico, digamos TH, indica que el primer lanzamiento dio como 
resultado una cruz seguida por una cara en el segundo lanzamiento. Así, estas probabi- 
lidades son precisamente las frecuencias relativas para los eventos dados a largo plazo. 


Por lo tanto, 
1 1 1 1 1 
и =E(X)=(0) (3) + (5) +0 G) = 1. 


Este resultado significa que una persona que lance 2 monedas una y otra vez obtendrá, 
en promedio, 1 cara por cada lanzamiento. 

El método descrito antes para calcular el número esperado de caras cada vez que se 
lanzan 2 monedas sugiere que la media, o el valor esperado de cualquier variable alea- 
toria discreta, se puede obtener multiplicando cada uno de los valores ХХХ, de la 
variable aleatoria X por su probabilidad correspondiente f(x, ), f(x, ),..., f(x, ) y sumando 
los productos. Esto es cierto, sin embargo, sólo si la variable aleatoria es discreta. En 
el caso de variables aleatorias continuas la definición de un valor esperado es esencial- 
mente la misma, pero las sumatorias se reemplazan con integrales. 


Sea X una variable aleatoria con distribución de probabilidad f(x). La media o valor 
esperado de X es 


к= Е(Х) = S 


si X es discreta, y 


оо 


p=E(X) = | ходах 


si Х es continua. 


El lector debe advertir que la forma para calcular el valor esperado, o media, que se 
muestra aquí es diferente del método para calcular la media muestral que se describió 
en el capítulo 1, donde la media muestral se obtuvo usando los datos. En la esperanza 
matemática el valor esperado se obtiene usando la distribución de probabilidad. 
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Sin embargo, la media suele considerarse un valor “central” de la distribución sub- 
yacente si se utiliza el valor esperado, como en la definición 4.1. 


Ejemplo 4.1: Un inspector de calidad obtiene una muestra de un lote que contiene 7 componentes; el 


Solución: 


lote contiene 4 componentes buenos y 3 defectuosos. El inspector toma una muestra de 
3 componentes. Calcule el valor esperado del número de componentes buenos en esta 
muestra. 

Sea X el número de componentes buenos en la muestra. La distribución de probabilidad 
de X es 


f(x) = x= 0,1,2,3. 


AA 
(5) 
Unos cálculos sencillos dan /(0) = 1/35, f(1) = 12/35, f(2) = 18/35 y f(3) = 4/35. Por 

lo tanto, 


1 12 18 4 12 
и = E(X) = (0) (=) + (1) (55) + (2) (55) + (3) (5) == | 


De esta manera, si de un lote de 4 componentes buenos y 3 defectuosos, se seleccionara 
al azar, una y otra vez, una muestra de tamaño 3, ésta contendría en promedio 1.7 com- 
ponentes buenos. JJ 


Ejemplo 4.2: | Cierto día un vendedor de una empresa de aparatos médicos tiene dos citas. Considera 


Solución: 


que en la primera cita tiene 70 por ciento de probabilidades de cerrar una venta, por 
la cual podría obtener una comisión de $1000. Por otro lado, cree que en la segunda cita 
sólo tiene 40 por ciento de probabilidades de cerrar el trato, del cual obtendría $1500 de 
comisión. ¿Cuál es su comisión esperada con base en dichas probabilidades? Suponga 
que los resultados de las citas son independientes. 

En primer lugar sabemos que el vendedor, en las dos citas, puede obtener 4 comisiones 
totales: $0, $1000, $1500 y $2500. Necesitamos calcular sus probabilidades asociadas. 
Mediante la independencia obtenemos 


F ($0) = (1 —0.7)1 — 0.4) = 0.18, £($2500) = (0.7)(0.4) = 0.28, 
7 ($1000) = (0.7)(1 — 0.4) = 0.42, y f($1500) = (1 — 0.7)(0.4) = 0.12. 


Por lo tanto, la comisión esperada рага el vendedor es 


E(X) =($0)(0.18) + ($1000)(0.42) + ($1500)(0.12) + ($2500)(0.28) 
= $1300. 3 


Los ejemplos 4.1 y 4.2 se diseñaron para que el lector comprenda mejor lo que 
queremos decir con la frase valor esperado de una variable aleatoria. En ambos casos 
las variables aleatorias son discretas. Seguimos con un ejemplo de variable aleatoria 
continua, donde un ingeniero se interesa en la vida media de cierto tipo de dispositivo 
electrónico. Ésta es una ilustración del problema tiempo que transcurre antes de que se 
presente una falla que se enfrenta a menudo en la práctica. El valor esperado de la vida 
del dispositivo es un parámetro importante para su evaluación. 
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Ejemplo 4.3: | Sea X la variable aleatoria que denota la vida en horas de cierto dispositivo electrónico. 


Solución: 


Teorema 4.1: 


La función de densidad de probabilidad es 


20:00 35100, 
Р(х) = * 
0, en otro caso. 


Calcule la vida esperada para esta clase de dispositivo. 
Si usamos la definición 4.1, tenemos 


20,000 20,000 
к=к(Х)= | х = в = | z dx = 200. 
100 x 100 х 
Рог lo tanto, esperamos que este про de dispositivo dure en promedio 200 horas. JJ 


Consideremos ahora una nueva variable aleatoria g(X), la cual depende de X; es 
decir, cada valor de g(X) es determinado por el valor de X. Por ejemplo, g(X) podría ser 
X?*03X- 1, y siempre que X asuma el valor 2, g(X) toma el valor 2(2). En particular, si 
X es una variable aleatoria discreta con distribución de probabilidad f(x), рага x = —1, 0, 
1,2 y (X) = X?, entonces, 


Plg(X)=0]=P(X =0) = 7 (0), 
пее =—1)+Р(Х=1)=/(—1)+/@), 
Р[8(Х) = 4]= Р(Х = 2) = } (2), 


así que la distribución de probabilidad de g(X) se escribe como 


g(x) 0 1 4 
Ple (Х = 2(х)1 | O /—1) + fA) FO) 


Por medio de la definición del valor esperado de una variable aleatoria obtenemos 
Шах) = Elg(x)] =0£ (0) + UA=D +E +4730) 
=(—1)27(-1) + (0)27 (0) + DF 1) + (292502) = X ofa). 


Este resultado se generaliza en el teorema 4.1 para variables aleatorias discretas у con- 
tinuas. 


Sea X una variable aleatoria con distribución de probabilidad f(x). El valor esperado de 
la variable aleatoria g(X) es 


Hgo = EBOI = У а(х) (х) 


si X es discreta, у 


рих) = ЕХ) = | (ок 


si Х es continua. 
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Ejemplo 4.4: | Suponga que el número de automóviles X que pasa por un local de lavado de autos entre 
las 4:00 р.м. y las 5:00 р.м. de cualquier viernes soleado tiene la siguiente distribución 
de probabilidad: 

х 4 6 7 8 9 


Э 
= 1 1 I I 1l 
P(X =х)|ту тото 2 6 6 


Sea g(X) = 2X — 1 la cantidad de dinero en dólares que el administrador paga al opera- 
dor. Calcule las ganancias esperadas del operador en este periodo específico. 
Solución: Por el teorema 4.1, el operador puede esperar recibir 


9 


Е[#(Х)] = EQX – 1) = Y (Ох —1)/(х) 


x=4 
=( 7 l 9 l 11 І 13 l 
1 1 
+ (15) (5) + (17) (5) = $12.67. Г 


Ejemplo 4.5: | Sea X una variable aleatoria con función de densidad 


ros fa =1<x<2, 


0, en otro caso. 


Calcule el valor esperado de g(X) = 4X + 3. 
Solución: Por el teorema 4.1 tenemos 


2 2 2 
4 1 
к@х +3у= | ERA МИ / Сариев, 
=i 3 3 pe] J 


Debemos extender ahora nuestro concepto de esperanza matemática al caso de dos 
variables aleatorias X y Y con distribución de probabilidad conjunta f(x, y). 


Definición 4.2: Sean X y Y variables aleatorias con distribución de probabilidad conjunta f(x, y). La 
media o valor esperado de la variable aleatoria g(X, Y) es 


hex ү) =Elg(X, У = у у 2094 E y) 


X 


si X y Y son discretas, y 
man ЕХ, 01 | | куубу) d dy 
si X y Y son continuas. 


Es evidente la generalización de la definición 4.2 para el cálculo de la esperanza 
matemática de funciones de varias variables aleatorias. 
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Ejemplo 4.6: | Sean X y Y variables aleatorias con la distribución de probabilidad conjunta que se indi- 
ca en la tabla 3.1 de la página 96. Calcule el valor esperado de g(X, Y) = XY. Por conve- 
niencia se repite aquí la tabla. 


х Totales 
fœ y) O 1 2 porrenglón 
0 3 9 3 15 
8 28 28 28 
y | ион 0| 5 
1 1 
2 х 0 0 эк 
э BE 3 
Totales рог columa| р Жо = 1 


Solución: Por la definición 4.2, escribimos 


2 2, 
Е(ХҮ)= Y Y ху (х, у) 


x=0 y=0 
= (010) f (0,0) + (001) f (0, 1) 
+ (000) 0,0 + DA) FA, D + (10) 7 2,0) 


3 
=f(l, 1) = —. 
fa, D= -73 Г 
Ејетріо 4.7: | Calcule E(Y/X) para la siguiente función de densidad 
HE. Q<x<2,0<y<1 
fœ у) = | ко | КЫЫ 
0, en otro caso. 
Solución: Tenemos 

Y 1 (2 у(1 + 3y? l y + 3y? 5 
El% -=f Í O aay = | ах pa 


Observe que si g(X, Y) = X en la definición 4.2, tenemos 


Erfa у) = Y xg (a) (caso discreto), 
Е(Ху= (х > х 
ЈГ SS х, y) ау ах = | xg(x) ах (caso continuo), 


donde g(x) es la distribución marginal de X. Por lo tanto, para calcular Е(Х) en un espa- 
cio bidimensional, se puede utilizar tanto la distribución de probabilidad conjunta de X 
y Y, como la distribución marginal de X. De manera similar, definimos 


Ny (х у) = Y yho) (caso discreto), 
Е(Үу= 7% ; 


Jh Es yf (x y) dxdy = Jos yh(y) dy (caso continuo), 


donde h(y) es la distribución marginal de la variable aleatoria Y. 


Ejercicios 


Ejercicios 


4.1 Enel ejercicio 3.13 de la página 92 se presenta la 
siguiente distribución de probabilidad de X, el número 
de imperfecciones que hay en cada 10 metros de una 
tela sintética, en rollos continuos de ancho uniforme 


0 1 2 3 4 
041 037 016 0.05 0.01 


х 

Јо) 
Calcule el número promedio de imperfecciones que 
hay en cada 10 metros de esta tela. 


4.2 La distribución de probabilidad de la variable 
aleatoria discreta X es 


* 3-х 
г®= fi) (4) (3) , x=0,1,2,3. 


Calcule la media de X. 


4.3 Calcule la media de la variable aleatoria Т que 
representa el total de las tres monedas del ejercicio 3.25 
de la página 93. 


4.4 Una moneda está cargada de manera que la pro- 
babilidad de ocurrencia de una cara es tres veces mayor 
que la de una cruz. Calcule el número esperado de cru- 
ces si esta moneda se lanza dos veces. 


4.5 En un juego de azar a una mujer se le pagan $3 si 
saca una jota o una reina, y $5 si saca un rey o un as de 
una baraja ordinaria de 52 cartas. Si saca cualquier otra 
carta, pierde. ¿Cuánto debería pagar si el juego es justo? 


4.6 А un operador de un local de lavado de autos se 
le paga de acuerdo con el número de automóviles que 
lava. Suponga que las probabilidades de que entre las 
4:00 p.m. y las 5:00 p.m. de cualquier viernes soleado 
reciba $7, $9, $11, $13, $15 0 $17 son: 1/12, 1/12, 1/4, 
1/4, 1/6 y 1/6, respectivamente. Calcule las ganancias 
esperadas del operador para este periodo específico. 


4.7 Si una persona invierte en unas acciones en par- 
ticular, en un año tiene una probabilidad de 0.3 de ob- 
tener una ganancia de $4000 o una probabilidad de 0.7 
de tener una pérdida de $1000. ¿Cuál es la ganancia 
esperada de esta persona? 


4.8 Suponga que un distribuidor de joyería antigua 
está interesado en comprar un collar de oro para el que 
tiene 0.22 de probabilidades de venderlo con $250 de 
utilidad; 0.36 de venderlo con $150 de utilidad; 0.28 
de venderlo al costo y 0.14 de venderlo con una pér- 
dida de $150. ¿Cuál es su utilidad esperada? 


4.9 Un piloto privado desea asegurar su avión por 
$200,000. La aseguradora estima que la probabilidad 
de pérdida total es de 0.002, que la probabilidad de 
una pérdida del 50% es de 0.01 y la probabilidad de una 
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pérdida del 25% es de 0.1. Si se ignoran todas las de- 
más pérdidas parciales, ¿qué prima debería cobrar ca- 
da año la aseguradora para tener una utilidad promedio 
de $500? 


4.10 Dos expertos en calidad de neumáticos exami- 
nan lotes de éstos y asignan a cada neumático puntua- 
ciones de calidad en una escala de tres puntos. Sea X 
la puntuación dada por el experto A y Y la dada por el 
experto B. La siguiente tabla presenta la distribución 
conjunta para X y Y. 


1 [0.10 0.05 0.02 
x| 2 [0.10 0.35 0.05 
3 | 0.03 0.10 0.20 
Calcule и, y u, 


4.11 La función de densidad de las mediciones codi- 
ficadas del diámetro de paso de los hilos de un encaje 
es 


А 
о ат O<x<l, 
0 


A en otro caso. 


Calcule el valor esperado de X. 


4.12 Si la utilidad para un distribuidor de un automó- 
vil nuevo, en unidades de $5000, se puede ver como 
una variable aleatoria X que tiene la siguiente función 


de densidad 
зву | =x), O<x<l, 


0, еп о{го са$о. 


Calcule la utilidad promedio por automóvil. 


4.13 La función de densidad de la variable aleatoria 
continua X, el número total de horas que una familia 
utiliza una aspiradora durante un año, en unidades de 
100 horas, se da en el ejercicio 3.7 de la página 92 como 


Ж; О<х < 1, 
Рох) =4 2-х, l<x<2, 
0, еп оїго саѕо. 


Calcule el número promedio de horas por año que las 
familias utilizan sus aspiradoras. 


4.14 Calcule la proporción X de personas que se podría 
esperar que respondieran a cierta encuesta que se envía 
por correo, si X tiene la siguiente función de densidad 


Ax+2) 
=} ы» VUEx<l, 


0, еп otro caso. 
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4.15 Suponga que dos variables aleatorias (X, Y) están 
distribuidas de manera uniforme en un círculo con ra- 
dio a. Entonces, la función de densidad de probabilidad 


conjunta es 
І 


f D= {5 


Calcule и„ el valor esperado de X. 


*+y<a, 
en otro caso. 


4.16 Suponga que usted inspecciona un lote de 1000 
bombillas de luz, entre las cuales hay 20 defectuosas, y 
elige al azar dos bombillas del lote sin reemplazo. Sean 


x = 1, si la primera bombilla está defectuosa, 
! = 10, en otro caso. 


X= 1, si la segunda bombilla está defectuosa, 
2 = 1 0, en otro caso. 


Calcule la probabilidad de que al menos una de las bom- 
billas elegidas esté defectuosa. [Sugerencia: Calcule 
Р(Х + Х, = 1).] 
4.17 Sea X una variable aleatoria con la siguiente dis- 
tribución de probabilidad: 
x | —3 6 9 
Ро) | 1/6 12 13 


Calcule и, w» donde g(X) = (2X + 1). 


4.18 Calcule el valor esperado de la variable aleatoria 
2(X) = X?, donde X tiene la distribución de probabili- 
dad del ejercicio 4.2. 


4.19 Una empresa industrial grande compra varios 
procesadores de textos nuevos al final de cada año; el 
número exacto depende de la frecuencia de reparacio- 
nes del año anterior. Suponga que el número de proce- 
sadores de textos, X, que se compran cada año tiene la 
siguiente distribución de probabilidad: 
x | 0 1 2 3 

fœ) | 110 310 2/5 1/5 
Si el costo del modelo deseado es de $1200 por uni- 
dad y al final del año la empresa obtiene un descuento 
de 50X? dólares, ¿cuánto espera gastar esta empresa en 
nuevos procesadores de textos durante este año? 


4.20 Una variable aleatoria continua X tiene la siguien- 
te función de densidad 


ех, x>0, 
fœ = 10 en otro caso. 
Calcule el valor esperado de g(X) = e, 


4.21 ¿Cuál es la utilidad promedio por automóvil que 
obtiene un distribuidor, si la utilidad en cada uno está 
dada рог g(X) = X, donde X es una variable aleatoria 
que tiene la función de densidad del ejercicio 4.12? 
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4.22 El periodo de hospitalización, en días, para pa- 
cientes que siguen el tratamiento para cierto tipo de 
trastorno renal es una variable aleatoria Y = X + 4, 
donde X tiene la siguiente función de densidad 


32 
fœ) = pr x>0, 


0, en otro caso. 


Calcule el número promedio de días que una persona 
permanece hospitalizada con el fin de seguir el trata- 
miento para dicha enfermedad. 


4.23 Suponga que X y Y tienen la siguiente función 
de probabilidad conjunta: 


х 
FG y) 2 4 
1 (0.10 0.15 
y| 3 | 0.20 0.30 
5 [0.10 0.15 


а) Calcule el valor esperado de g(X, У) = ХҮ?. 
b) Calcule u, уи. 


4.24 Remítase a las variables aleatorias cuya distri- 
bución de probabilidad conjunta se da en el ejercicio 
3.39 de la página 105 y 

a) calcule Е(ХҮ – 2XY); 

b) calcule u,- u, 


4.25 Remítase a las variables aleatorias cuya distri- 
bución de probabilidad conjunta se da en el ejercicio 
3.51 de la página 106 y calcule la media para el nú- 
mero total de jotas y reyes cuando se sacan 3 cartas, 
sin reemplazo, de las 12 cartas mayores de una baraja 
ordinaria de 52 cartas. 


4.26 Sean X y Y las siguientes variables aleatorias con 
función de densidad conjunta 
4ху, 


FO у) = F 


О<х, у <1, 
en otro caso. 


Calcule el valor esperado de Z = yX? + Y?. 


4.27 En el ejercicio 3.27 de la página 93 una función 
de densidad está dada por el tiempo que tarda en fallar 
un componente importante de un reproductor de DVD. 
Calcule el número medio de horas antes de que em- 
piece a fallar el componente y, por lo tanto, el repro- 
ductor de DVD. 


4.28 Considere la información del ejercicio 3.28 de 
la página 93. El problema tiene que ver con el peso, en 
onzas, del producto que contiene una caja de cereal con 


2, 23.75 <x < 26.25 
—_ )5, =х = , 
fœ) = || en otro caso. 


4.2 Varianza y covarianza de variables aleatorias 


a) Grafique la función de densidad. 

b) Calcule el valor esperado o peso medio en onzas. 

c) ¿Se sorprende de su respuesta en b)? Explique lo 
que responda. 


4.29 El ejercicio 3.29 de la página 93 se refiere a una 
importante distribución del tamaño de las partículas ca- 
racterizada por 

3x7, 


rosdi 


a) Grafique la función de densidad. 
b) Determine el tamaño medio de la partícula. 


x >l; 
en otro caso. 


4.30 En el ejercicio 3.31 de la página 94 la distribu- 
ción del tiempo que transcurre antes de que una lava- 
dora requiera una reparación mayor fue dada como 


_ Íz у>0, 
бше: 


en otro caso. 
¿Cuál es la media de población del tiempo que transcu- 
rre antes de requerir la reparación? 
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4.31 Considere el ejercicio 3.32 de la página 94. 

a) ¿Cuáles la proporción media del presupuesto asig- 
nado para el control ambiental y de la contamina- 
ción? 

b) ¿Cuál es la probabilidad de que una empresa ele- 
gida al azar tenga una proporción asignada para el 
control ambiental y de la contaminación que ex- 
ceda la media de la población dada en a)? 


4.32 En el ejercicio 3.13 de la página 92 la distribu- 
ción del número de imperfecciones en cada 10 metros 
de tela sintética fue dada por 


x |0 1 2 3 4 
Јо) | 0.41 037 0.16 0.05 0.01 


a) Grafique la función de probabilidad. 

b) Calcule el número de imperfecciones esperado 
EX) = и. 

c) Calcule Е(Х?). 


4.2 Varianza y covarianza de variables aleatorias 


La media o valor esperado de una variable aleatoria X es de especial importancia en esta- 
dística porque describe en dónde se centra la distribución de probabilidad. Sin embargo, 
la media por sí misma no ofrece una descripción adecuada de la forma de la distribución. 
También se necesita clasificar la variabilidad en la distribución. En la figura 4.1 tenemos 
los histogramas de dos distribuciones de probabilidad discretas con la misma media 
и = 2, pero que difieren de manera considerable en la variabilidad o dispersión de sus 


observaciones sobre la media. 


Figura 4.1: Distribuciones con medias iguales y dispersiones diferentes. 


La medida de variabilidad más importante de una variable aleatoria X se obtiene 
aplicando el teorema 4.1 con g(X) = (X – и). A esta cantidad se le denomina varianza 
de la variable aleatoria X o varianza de la distribución de probabilidad de X y se 
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denota como Var(X), o con el símbolo о, ‚ О simplemente como о? cuando es evidente а 
qué variable aleatoria se está haciendo referencia. 


Definición 4.3: Sea X una variable aleatoria con distribución de probabilidad f(x) y media и. La varian- 
za de X es 


0?=E[(X — ш)?] = YE —w?f (x), 5 X es discreta, y 


с? = Е[(Х —p?]= | (х = u)f (х) dx, 81 Х es continua. 
La raíz cuadrada positiva de la varianza, с, se Пата desviación estándar de X. 


La cantidad x — и en la definición 4.3 se llama desviación de una observación 
respecto a su media. Como estas desviaciones se elevan al cuadrado y después se pro- 
median, 0? será mucho menor para un conjunto de valores х que estén cercanos а и, que 
para un conjunto de valores que varíe de forma considerable de u. 


Ejemplo 4.8: | Suponga que la variable aleatoria X representa el número de automóviles que se utilizan 
con propósitos de negocios oficiales en un día de trabajo dado. La distribución de proba- 
bilidad para la empresa A [figura 4.1(a)] es 


x |1 2 3 
FG) [03 04 03 


y para la empresa В [figura 4.1(b)] es 


x о0о 1 2 3 4 
FO) 102 0.1 03 03 0.1 


Demuestre que la varianza de la distribución de probabilidad para la empresa B es mayor 
que la de la empresa A. 
Solución: Para la empresa A encontramos que 
pa =E(X)= (10.3) + (2)(0.4) + (310.3) = 2.0, 
y entonces 
3 
са =X œ -2° = (1 – 2)2(0.3) + (2 — 2)? (0.4) + (3 – 2)200.3) =0.6. 


x=1 
Para la empresa B tenemos 
ив = E(X ) = (010.2) + (110.1) + (2)(0.3) + (3)(0.3) + (4)(0.1) = 2.0, 
y entonces 


4 
св = у U-2f() 


x=0 
(0 — 2)2(0.2) + (ЛП —2)2(0.1) ++ О — 2)2(0.3) 
+(3-—2)°(0.3у+4 (4 =2)у°(01) = 1.6. 
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Es evidente que la varianza del número de automóviles que se utilizan con propósitos de 
negocios oficiales es mayor para la empresa B que para la empresa A. 

Una fórmula alternativa que se prefiere para calcular о”, que a menudo simplifica 
los cálculos, se establece en el siguiente teorema. 


Teorema 4.2: La varianza de una variable aleatoria X es 


2 E(X?) и? 


Prueba: Para el caso discreto escribimos 


т, -p f(x) = >= —2их + p’) f(x) 
-5e fa) — yaoi 2 $0). 


Como u = 2, f(x) por definición, y 2 f(x) = 1 para cualquier distribución de pro- 


babilidad discreta, se deduce que 
о? = Ухо) р? = ЕХ?) – р? 


Рага el caso continuo la demostración es Іа misma paso а paso, reemplazando las suma- 
torias por integrales. 


Ejemplo 4.9: | Suponga que la variable aleatoria X representa el número de partes defectuosas de una 
máquina cuando de una línea de producción se obtiene una muestra de tres partes y se 
somete a prueba. La siguiente es la distribución de probabilidad de X. 


x | 0 1 2 3 
f(x) | 0.51 0.38 0.10 0.01 


Utilice el teorema 4.2 y calcule o”. 
Solución: Primero calculamos 


= (010.51) + (1)(0.38) + (2)(0.10) + (30.01) = 0.61. 
Luego, 
E(X?) = (000.51) + (100.38) + (40.10) + (910.01) = 0.87. 
Por lo tanto, 


с? = 0.87 — (0.61)? = 0.4979. J 


Ejemplo 4.10: |La demanda semanal de una bebida para una cadena local de tiendas de abarrotes, en 
miles de litros, es una variable aleatoria continua X que tiene la siguiente densidad de 
probabilidad 

2x=1), 1<х<2, 
f(x) = f 


0, en otro caso. 


Calcule la media y la varianza de X. 
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Solución: 


Teorema 4.3: 


Prueba: 
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Al calcular E(X) y E(X?) tenemos 


a 5 
п=Е0)=2 | x=) de =? 
1 


2, 
Е(Х?) = 2f x’ (x = 1) dx = 2. 
1 


о E _.1 
@°= — == 
6 \з 18 Г 


Hasta el momento la varianza о la desviación estándar sólo tiene significado cuando 
comparamos dos o más distribuciones que tienen las mismas unidades de medida. Por lo 
tanto, podemos comparar las varianzas de las distribuciones de contenido, medido en 
litros, de botellas de jugo de naranja de dos empresas, y el valor más grande indicaría la 
empresa cuyo producto es más variable o menos uniforme. No tendría caso comparar 
la varianza de una distribución de estaturas con la varianza de una distribución de califi- 
caciones de aptitud. En la sección 4.4 mostramos cómo se utiliza la desviación estándar 
para describir una sola distribución de observaciones. 

Extenderemos ahora nuestro concepto de varianza de una variable aleatoria X para 
incluir también variables aleatorias relacionadas con X. Para la variable aleatoria g(X) la 
varianza se denotará por A х) y se calculará empleando el siguiente teorema. 


Por lo tanto, 


Sea X una variable aleatoria con distribución de probabilidad f(x). La varianza de la 
variable aleatoria g(X) es 


Tex) = EBO) ор) = У 180) -kof /(Х) 
si X es discreta, y 


Tx) = E {I8(X) — рео) =| [#(х) — Hex) f (x) dx 


200 


si X es continua. 


Como g(X) es en sí misma una variable aleatoria con media Hx COMO SE define en el 
teorema 4.1, de la definición 4.3 se deduce que 


0) = Е{[8(Х) — Шеху]. 


Ahora bien, la demostración se completa aplicando nuevamente el teorema 4.1 a la va- 


riable aleatoria [200 — Ml. JJ 


Ejemplo 4.11: | Calcule la varianza de g(X) = 2X + 3, donde X es una variable aleatoria con la siguiente 


distribución de probabilidad 
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Solución: 


Primero se calcula la media de la variable aleatoria 2X + 3. De acuerdo con el teorema 4.1, 
3 
Шох +3 =E(QX +3) = У (2х + 3) (x) = 6. 
х= 0 


Ahora, usando el teorema 4.3, tenemos 


с, м =ЕЦОХ +3) – 43) = EIX +3-6)?] 
3 
= Е(АХ?—12Х +9) = У? — 12x +9) f(x) = 4. 
х=0 J 


Ejemplo 4.12: | Sea X una variable aleatoria que tiene la función de densidad dada en el ejemplo 4.5 de 


Solución: 


Definición 4.4: 


la página 115. Calcule la varianza de la variable aleatoria g(X) = 4X + 3. 
En el ejemplo 4.5 encontramos que и, , , = 8. Ahora bien, usando el teorema 4.3, 


O ix аз = E ([(4X +3) —8P) =E[(4X – 5)2] 
? 2х? 15. 4 3 2 51 
= | (4х —5)°—— ах = = | (16x* – 40x? + 25х2) dx = —. 
-1 3 3): 5 3 


Si g(X, Y) = (Х— 1 NY — u,), donde u, = E(X) y u, = E(Y), la definición 4.2 da un 
valor esperado denominado covarianza de X у Y, que se denota por с, o Соу(Х, Y). 


Sean X y Y variables aleatorias con distribución de probabilidad conjunta f(x, y). La 
covarianza de X y Y es 


бу = ЕХ – р ХҮ -m)l = Y Y — их Ху у) (л, y) 


51 X y Y son discretas, y 
Or =E -WXY -m= ANN de dy 


si X y Y son continuas. 


La covarianza entre dos variables aleatorias es una medida de la naturaleza de la 
asociación entre ambas. Si valores grandes de X a menudo dan como resultado valores 
grandes de Y, o valores pequeños de X, dan como resultado valores pequeños de Y, 
X – и, positiva con frecuencia dará como resultado Y — u, positiva, y X — и, negativa 
a menudo dará como resultado Y — и, negativa. Por consiguiente, el producto (X — u,) 
(Y — u,) tenderá a ser positivo. Por otro lado, si con frecuencia valores grandes de X dan 
como resultado valores pequeños de Y, entonces el producto (X — u,)(Y — и,) tenderá а 
ser negativo. El signo de la covarianza indica si la relación entre dos variables aleatorias 
dependientes es positiva o negativa. Cuando X y Y son estadísticamente independientes, 
se puede demostrar que la covarianza es cero (véase el corolario 4.5). Lo opuesto, sin 
embargo, por lo general no es cierto. Dos variables pueden tener covarianza cero y aun 
así no ser estadísticamente independientes. Observe que la covarianza sólo describe la 
relación lineal entre dos variables aleatorias. Por consiguiente, si una covarianza entre X 
y Y es cero, X y Y podrían tener una relación no lineal, lo cual significa que no necesa- 
riamente son independientes. 
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La fórmula alternativa que se prefiere para с,, se establece en el teorema 4.4. 


Teorema 4.4: La covarianza de dos variables aleatorias X y Y, con medias u, y u, respectivamente, 
está dada por 


Oxy = E(XY) — Hx Hr. 


Prueba: Para el caso discreto escribimos 


Ta = У У-у) y) 


х y 


=ў у wa у)—!ь УУЛА у) 
— № УУ х/ф, у) + Hx Hry NOS fa y). 
х y 


Dado que 


pa = Уо у). шь =D y у), y DS y) =1 


para cualquier distribución discreta conjunta se deduce que 
Oxy = Е(ХҮ) = Hy Hy — Hy Hx + Hx Mr =E(XY) — Hx Hr. 


Para el caso continuo la demostración es idéntica, pero las sumatorias se reemplazan por 
integrales. 


Ejemplo 4.13: |En el ejemplo 3.14 de la página 95 se describe una situación acerca del número de re- 
puestos azules X y el número de repuestos rojos Y. Cuando de cierta caja se seleccionan 
dos repuestos para bolígrafo al azar y la distribución de probabilidad conjunta es la si- 


guiente, 
Š 

fœy)| O 1 2 |А) 
0 3 9 3 15 
8 28 28 28 
ОЕ 
2 х 0 0 8 

5 5 3 
80) a ж g|! 


Calcule la covarianza de X y Y. 
Solución: Del ejemplo 4.6 vemos que Е(ХҮ) = 3/14. Ahora bien, 


2 5 15 3 3 
Hx = 2 жб) = (0) (5) + (1) (з) + (2) (5) = 2, 


E 15 3 1 1 
и, = эво) = (0) (5) +(1) (5) + (2) (ж) => 
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Por lo tanto, 


E 9 
Ma E BUD) Pa а G) (5) = се: 


Ejemplo 4.14: |La fracción X de corredores y la fracción Y de corredoras que compiten en carreras 
de maratón se describen mediante la función de densidad conjunta 


8xy, O<y<x<l, 
0, en otro caso. 


/®у)={ 


Calcule la covarianza de X y Y. 
Solución: Primero calculamos las funciones de densidad marginal. Estas son 


(ху) = 4x3, 0<х<1, 
g © 10, en otro caso, 


4y(1—y?), O<y<l, 
hb) = И 
о) le en otro caso, 


A partir de las funciones de densidad marginal dadas, calculamos 


1 1 
4 8 
№ Ех) = | т" - | 4у?(1 – y?) dy = —. 
А 5 б 15 


De las funciones de densidad conjunta dadas arriba, tenemos 
1 pl 4 
Е(ХҮ)= / | 8x2y? dx dy =-. 

0 y 9 


Entonces, 


4 4 8 4 
оу =E(XY ) —Hx = 9 (5) (55) Б 225' JJ 


Aunque la covarianza entre dos variables aleatorias brinda información respecto de 
la naturaleza de la relación, la magnitud de с, no indica nada respecto a la fuerza de la 
relación, ya que с, depende de la escala. Su magnitud dependerá de las unidades que se 
utilicen para medir X y Y. Hay una versión de la covarianza sin escala que se denomina 
coeficiente de correlación y se utiliza ampliamente en estadística. 


Definición 4.5: Sean X у Y variables aleatorias con covarianza O, y desviaciones estándar O, y O,, 
respectivamente. El coeficiente de correlación de X y Y es 


Oxy 


Px = 


TO 


Debería quedar claro para el lector que p,, no tiene las unidades de X y Y. El coefi- 
ciente de correlación satisface la desigualdad —1 < p,, < 1. Toma un valor de cero cuando 
Oy = 0. Donde hay una dependencia lineal exacta, digamos Y = a + bX, p,, = 1 si 


126 Capítulo 4 Esperanza matemática 


b>0yp,,=-— 1 sib<0. (Véase el ejercicio 4.48). En el capítulo 12, donde examinare- 
mos la regresión lineal, analizamos más a fondo el coeficiente de correlación. 


Ejemplo 4.15: | Calcule el coeficiente de correlación entre X y Y en el ejemplo 4.13. 


Solución: Dado que 
оз E A оз (3-27 
кө) (Д) +а® (2) ао (5) = 


15 3 1 4 
Е(Ү?) =(0%) (5) a°?) G) + 0?) (5) = 


ОЕ К ЖОЕ Жо И 
x =z 7—44) Tm 977712) “2% 


Por lo tanto, el coeficiente de correlación entre X y Y es 


obtenemos 


_ бу _ —9/ 56 с 1] 
Ox Oy /(45/112)09728 ү. 3 


рхү 


Ejemplo 4.16: | Calcule el coeficiente de correlación entre Х y Y en el ejemplo 4.14. 
Solución: Dado que 


1 1 
2 2 1 
Е = | 4х5 di = = у Е(0) = | ra) 4 =1=3=3, 
0 0 
concluimos que 
52 22 4ү _ Е s\ O n 
x237A5 75 7° A TE 225 
Por lo tanto, 
_ 4/ 225 4 
и \/0/75)(11/225) V66 Г 


Observe que, aunque la covarianza en el ejemplo 4.15 tiene mayor magnitud (sin im- 
portar el signo) que la del ejemplo 4.16, la relación entre las magnitudes de los coeficien- 
tes de correlación en estos dos ejemplos es exactamente la inversa. Esto es evidencia de 
que no debemos basarnos en la magnitud de la covarianza para determinar la fuerza 
de la relación. 


Ejercicios 


Ejercicios 


4.33 Use la definición 4.3 de la página 120 para en- 
contrar la varianza de la variable aleatoria X del ejerci- 
cio 4.7 de la página 117. 

4.34 Sea X una variable aleatoria con la siguiente dis- 
tribución de probabilidad: 


x |-2 3 5 
fœ) | 0.3 02 05 


Calcule la desviación estándar de X. 


4.35 La variable aleatoria X, que representa el nú- 
mero de errores por 100 líneas de código de progra- 
mación, tiene la siguiente distribución de probabilidad: 


x |2 3 4 5 6 
о) |001 025 04 03 0.04 


Utilice el teorema 4.2 de la página 121 para calcular la 
varianza de X. 


4.36 Suponga que las probabilidades de que 0, 1, 2 o 
3 fallas de energía eléctrica afecten cierta subdivisión 
en cualquier año dado son 0.4, 0.3, 0.2 y 0.1, respecti- 
vamente. Calcule la media y la varianza de la variable 
aleatoria X que representa el número de fallas de ener- 
gía que afectan esta subdivisión. 


4.37 La utilidad que obtiene un distribuidor, en uni- 
dades de $5000, al vender un automóvil nuevo es una 
variable aleatoria X que tiene la función de densidad 
que se presenta en el ejercicio 4.12 de la página 117. 
Calcule la varianza de X. 


4.38 La proporción de personas que responden cierta 
encuesta que se manda por correo es una variable alea- 
toria X, la cual tiene la función de densidad del ejer- 
cicio 4.14 de la página 117. Calcule la varianza de X. 


4.39 El número total de horas que una familia utili- 
za una aspiradora en un año, en unidades de 100 ho- 
ras, es una variable aleatoria X que tiene la función de 
densidad dada en el ejercicio 4.13 de la página 117. 
Calcule la varianza de X. 


4.40 Remítase al ejercicio 4.14 de la página 117 y 
calcule ох) рага la función g(X) = ЗХ + 4. 


4.41 Calcule la desviación estándar de la variable 
aleatoria g(X) = (2X + 1) del ejercicio 4.17 en la pá- 
gina 118. 


4.42 Utilice los resultados del ejercicio 4.21 de la pá- 
gina 118 y calcule la varianza de g(X) = X, donde X es 
una variable aleatoria que tiene la función de densidad 
del ejercicio 4.12 de la página 117. 
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4.43 El петро que transcurre, en minutos, рага que 
un avión obtenga vía libre para despegar en cierto ae- 
ropuerto es una variable aleatoria Y = ЗХ ~ 2, donde X 
tiene la siguiente función de densidad 


1 -x/4 


го) = 12 , x>0 


0, еп оїго са$о. 


Calcule la media y la varianza de la variable aleatoria 
Y. 


4.44 Calcule la covarianza de las variables aleatorias 
X y Y del ejercicio 3.39 de la página 105. 


4.45 Calcule la covarianza de las variables aleatorias 
X y Y del ejercicio 3.49 de la página 106. 


4.46 Calcule la covarianza de las variables aleatorias 
X y Y del ejercicio 3.44 de la página 105. 


4.47 Calcule la covarianza de las variables aleatorias 
X y Y cuya función de densidad conjunta está dada en 
el ejercicio 3.40 de la página 105. 


4.48 Dada una variable aleatoria X, con desviación 
estándar с, y una variable aleatoria Y = a + bX, de- 
muestre que si b < 0, el coeficiente de correlación р,, 
=-1,ysib>0,p,,=1. 


4.49 Considere la situación del ejercicio 4.32 de la pá- 
gina 119. La distribución del número de imperfecciones 
por cada 10 metros de tela sintética está dada por 


x |0 1 2 3 4 
Ја) |041 037 016 0.05 001 


Calcule la varianza y la desviación estándar del número 
de imperfecciones. 


4.50 En una tarea de laboratorio, si el equipo está 
funcionando, la función de densidad del resultado ob- 
servado X es 


х= (09 


Calcule la varianza у la desviación estándar de X. 


0O<x<l, 
en otro caso. 


4.51 Determine el coeficiente de correlación entre X 
y Y para las variables aleatorias X y Y del ejercicio 3.39 
de la página 105. 


4.52 Las variables aleatorias X y Y tienen la siguiente 
distribución conjunta 


2, 0О<х<у<1, 
0, en otro caso. 


fæ, y) = | 


Determine el coeficiente de correlación entre X y Y. 
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4.3 Medias y varianzas de combinaciones lineales 
de variables aleatorias 


Teorema 4.5: 


Prueba: 


Corolario 4.1: 


Corolario 4.2: 


Ahora estudiaremos algunas propiedades útiles que simplificarán los cálculos de las me- 
dias y las varianzas de variables aleatorias que aparecen en los siguientes capítulos. 
Estas propiedades nos permitirán ocuparnos de las esperanzas matemáticas en términos 
de otros parámetros que ya conocemos o que ya calculamos con facilidad. Todos los 
resultados que presentamos aquí son válidos para variables aleatorias continuas y discre- 
tas. Las demostraciones se dan sólo para el caso continuo. Comenzamos con un teorema 
y dos corolarios que deberían ser, de forma intuitiva, razonables para el lector. 


Si a y b son constantes, entonces, 


E(aX + b) = aE (X) + b. 


Por la definición de valor esperado, 


оо оо 


Е (ах +»=/ (ах +b) f(x) d =a | 


— =00 


xf(x) dx sf f(x) dx. 


La primera integral de la derecha es E(X) y la segunda integral es igual a 1. Por lo tanto, 


E(aX +b) = aE (X) + b. J 


Al establecer que а = 0 vemos que E(b) = b. 


Al establecer que b = 0 vemos que E(aX) = aE(X). 


Ejemplo 4.17: | Aplique el teorema 4.5 а la variable aleatoria discreta f(X) = 2X — 1 para resolver de 


Solución: 


nuevo el ejemplo 4.4 de la página 115. 
De acuerdo con el teorema 4.5, escribimos 


Е(2Х —1) =2E(X)-1. 


Ahora, 
9 


Ш= Е(Х) =D xf) 


x=4 


(4 1 5 1 6 1 7 1 8 1 9 1 _ 41 


Por lo tanto, 


41 


Шох -1 = (2) (2) — 1 = $12.67, 


como antes. 
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Ejemplo 4.18: | Para resolver de nuevo el ejemplo 4.5 de la página 115 aplique el teorema 4.5 a la varia- 
ble aleatoria continua g(X) = 4X + 3. 
Solución: En el ejemplo 4.5 utilizamos el teorema 4.5 para escribir 


Е(4Х + 3) = 4Е(Х ) +3. 
Ahora, 


Por lo tanto, 
5 
E(4X +3) = (4) (3) +3=8, 
como antes. JJ 


Teorema 4.6: El valor esperado de la suma o diferencia de dos o más funciones de una variable alea- 
toria X es la suma o diferencia de los valores esperados de las funciones. Es decir, 


Elg(X) АХ )] =Elg(X)] + E [A(X )]. 
Prueba: Por definición, 
Е[в(Х)+Л(Х)|] = / lex) + Л(х)]/(х) ах 


=] g(x) f(x) dx F h(x) f(x) dx 


=Elg(X)] + E [A(X )]. J 


Ejemplo 4.19: | Sea X una variable aleatoria con la siguiente distribución de probabilidad: 
x |O 1 2 3 
1013 z 03 


Calcule el valor esperado de Y = (X – 1}. 
Solución: Si aplicamos el teorema 4.6 a la función Y = (X – 1), podemos escribir 


E(X – 1)2] =E(X?-2X +1) =E(X?) -2E(X)+E(1). 


A partir del corolario 4.1, E(1) = 1, y por cálculo directo 


1 1 1 
E(X) = (0) (3) + (0 (5) + (2)(0) + (3) (5) =1у 


E(X?) = (0) (3) +@) (5) + (4(0) + (9) (5) =2, 


En consecuencia, 


Е[(Х – 1)2]=2- (2)(1) +1 = 1. J 
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Ejemplo 4.20: | La demanda semanal de cierta bebida en una cadena de tiendas de abarrotes, en miles de 
litros, es una variable aleatoria continua g(X) = X? + X — 2, donde X tiene la siguien- 
te función de densidad 


20х = 1), 1<х<2, 
0, en otro caso. 


e | 


Calcule el valor esperado para la demanda semanal de la bebida. 
Solución: Por medio del teorema 4.6, escribimos 


E(X? +X -2) = E(X?) + E(X) — Е(2). 


A partir del corolario 4.1, Е(2) = 2, y por integración directa, 


E 5 2 17 
Е0) = | 2х(х — 1) dx = El ЕО?) = | 2х2(х — 1) ах = T 
1 1 
Entonces, 
17 5 5 
E(X? +X =2у=—+——=2=-— 
(Х + ) = 6 + 3 > 


así que la demanda semanal promedio de la bebida en esta cadena de tiendas de abarrotes 
es de 2500 litros. 

Suponga que tenemos dos variables aleatorias X y Y con distribución de proba- 
bilidad conjunta f(x, y). Dos propiedades adicionales que serán muy útiles en los ca- 
pítulos siguientes incluyen los valores esperados de la suma, la diferencia y el producto 
de estas dos variables aleatorias. Sin embargo, comenzaremos por demostrar un teorema 
sobre el valor esperado de la suma o diferencia de funciones de las variables dadas. Por 
supuesto, tan sólo se trata de una extensión del teorema 4.6. 


Teorema 4.7: El valor esperado de la suma o diferencia de dos o más funciones de las variables alea- 


torias X y Y es la suma o diferencia de los valores esperados de las funciones. Es decir, 


ElgX Ү)+ Р(Х, Y)] = Е[е(Х, Ү)] + Е[А(Х, Y). 
Prueba: Por la definición 4.2, 


ERX, Y) EAZ, n= f ү [буз ERGe NIT y) de dy 


= f elx, у) f(x, у) dx dy + ГА h(x, у) f(x, у) dx dy 


= Elg(X, Y)] + Е[Л(Х, У). J 


Corolario 4.3: Si establecemos que g(X, Y) = £(X) y A(X, Y) = (У), vemos que 


Elg(X) Е MY)] =Elg(X)] + Е[Л(Ү)]. 
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Corolario 4.4: 


Teorema 4.8: 


Prueba: 


Corolario 4.5: 


Prueba: 


Si establecemos que g(X, Y) = X y A(X, Y) = Y, vemos que 
MESA =D як л} |, 


Si X representa la producción diaria de algún artículo de la máquina А y Y la produc- 
ción diaria del mismo artículo de la máquina B, entonces X + Y representa la cantidad 
total de artículos que ambas máquinas producen diariamente. El corolario 4.4 establece 
que la producción diaria promedio para ambas máquinas es igual a la suma de la produc- 
ción diaria promedio de cada máquina. 


Sean X y Y dos variables aleatorias independientes. Entonces, 
CIO = (ХК(У ү 


Por la definición 4.2, 
E(XY )= / / ху] (х, у) ах dy. 


Сото Х y Y son independientes, podemos escribir 


Р(х, у) = 260) 0), 


donde g(x) y Л(у) son las distribuciones marginales de X y Y, respectivamente. En conse- 
cuencia, 


Ear) = | / хув(х)ћ(у) dx dy =f 800) a | К 
= E (X) E (Y). И | 


Para variables discretas el teorema 4.8 se ilustra mediante un experimento en el que 
se lanzan un dado verde y uno rojo. La variable aleatoria X representa el resultado de 
lanzar el dado verde y la variable aleatoria Y el resultado de lanzar el dado rojo. Enton- 
ces XY representa el producto de los números que resultan de lanzar el par de dados. A 
la larga el promedio de los productos de los números es igual al producto del número 
promedio que resulta de lanzar el dado verde y el número promedio que resulta de lanzar 
el dado rojo. 


Sean X y Y dos variables aleatorias independientes. Entonces, с,, = 0. 


La demostración se puede realizar utilizando los teoremas 4.4 y 4.8. J 


Ejemplo 4.21: | Se sabe que la proporción de galio y arseniuro no afecta el funcionamiento de las obleas 


de arseniuro de galio que son los principales componentes de los circuitos integrados. 
Denotemos con X la proporción de galio a arseniuro y con Y el porcentaje de obleas 
funcionales producidas durante una hora. X y Y son variables aleatorias independientes 
con la siguiente función de densidad conjunta 


‚2 
AA. б<хух<?2,0<у<1, 
fx y)= 
0, en otro caso. 
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Solución: 


Teorema 4.9: 


Prueba: 


Corolario 4.6: 


Corolario 4.7: 


Corolario 4.8: 
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Demuestre que E(XY) = Е(Х)Е(Ү), como sugiere el teorema 4.8. 
Por definición, 


1 2 9) 2 
х2у(1+3 5 4 5 
ЕФ = | f ADO ddy = ?, Е(Х)= =, у Е()= г. 
0 0 


Por lo tanto, 


4\ [5 5 
Е(Х)Е(Ү) = (5) Ө = = = Е(ХҮ). i 


Concluimos esta sección con la demostración de un teorema y la presentación de 
varios corolarios que son útiles para calcular varianzas o desviaciones estándar. 


Si X y Y son variables aleatorias con distribución de probabilidad conjunta f(x, y), y a, 
b y c son constantes, entonces 


2 2,2 2 
Dio Co EDO оова. 


Por definición, С +by +c = Ell(aX +bY + с) — Max +bY + P }. Entonces, 
Hax +bY +c = ElaX+bY +c) = аЕ(Х) + DE(Y) + c = ax +b +c, 


si utilizamos el corolario 4.4 y después el corolario 4.2. Por lo tanto, 


e roy +0 =E {A(X — px) +b — 11?) 
БЕО — и, Y] + Е[(Ү = и, )?]+2а4ЬЕ[(Х — uy XY =) 
= 20? +b? +2аЬо; . J 


Si utilizamos el teorema 4.9, tenemos los siguientes corolarios. 


Si se establece que b = 0, vemos que 


ОСО ОО 
Oax ъс = 00, = 


Si se establece que a = 1 y b = 0, vemos que 


а Б 
aer SO =0% 


Si se establece que b = 0 y с = 0, vemos que 


Es 
= са. 


а 

Los corolarios 4.6 y 4.7 establecen que la varianza no cambia si se suma o se resta 
una constante a una variable aleatoria. La suma o resta de una constante simplemente 
corre los valores de X a la derecha o a la izquierda, pero no cambia su variabilidad. Sin 
embargo, si una variable aleatoria se multiplica por una constante o se divide entre ésta, 
entonces los corolarios 4.6 y 4.8 establecen que la varianza se multiplica por el cuadrado 
de la constante o se divide entre éste. 
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Corolario 4.9: Si X y Y son variables aleatorias independientes, entonces 


Tx yr = ас? +02. 


El resultado que se establece en el corolario 4.9 se obtiene a partir del teorema 4.9 
y recurriendo al corolario 4.5. 


Corolario 4.10: Si X y Y son variables aleatorias independientes, entonces, 


оса ро 
El corolario 4.10 se obtiene reemplazando b por —b en el corolario 4.9. АІ genera- 


lizar a una combinación lineal de n variables aleatorias independientes, resulta el coro- 
lario 4.11. 


Corolario 4.11: Si X,, X,,..., X, son variables aleatorias independientes, entonces 


2 ES 2—2 222. 
Oana оо епа ~ O, ар 430 x, ida Ox, 


Ejemplo 4.22: |si x y Y son variables aleatorias con varianzas o? = 2 y 0? = 4 y covarianza O= —2, 
calcule la varianza de la variable aleatoria Z = ЗХ – 4Y + 8. 
Б РТ +в = Ox ay (por el corolario 4.6) 
= 902 +16 оў — 240,, (por el teorema 4.9) 


= (92) + (16)(4)— (2412) = 130. J 


Ejemplo 4.23: | Denotemos con X y Y la cantidad de dos tipos diferentes de impurezas en un lote de 
cierto producto químico. Suponga que X y Y son variables aleatorias independientes con 
varianzas 0? =2 y 0? = 3. Calcule la varianza de la variable aleatoria Z = ЗХ — 2Y 


+5. 
Solución: оў =O0 5-07. 20399. (porel corolario 4.6) 
== 90? + 40; (por el corolario 4.10) 
= (9)(2) + (46) = 30. 3 


¿Qué sucede si la función es no lineal? 


En las secciones anteriores estudiamos propiedades de funciones lineales de variables 
aleatorias por razones muy importantes. En los capítulos 8 a 15 se estudiarán y ejempli- 
ficarán problemas de la vida real, en los cuales el analista construye un modelo lineal 
para describir un conjunto de datos y, en consecuencia, describir o explicar el com- 
portamiento de un fenómeno científico. Así que resulta natural que encontremos los 
valores esperados y las varianzas de combinaciones lineales de variables aleatorias. Sin 
embargo, hay situaciones en que las propiedades de las funciones no lineales de varia- 
bles aleatorias se vuelven importantes. En efecto, hay muchos fenómenos científicos de 
naturaleza no lineal, donde el modelado estadístico que utiliza funciones no lineales 
adquiere gran importancia. De hecho, en el capítulo 12 se estudia el modelado de los 
que se han convertido en modelos estándar no lineales. En realidad, incluso una función 
simple de variables aleatorias, como Z = X/Y, ocurre con bastante frecuencia en la prác- 
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tica, y a diferencia del caso del valor esperado de las combinaciones lineales de variables 
aleatorias, no hay una simple regla general. Por ejemplo, 


Е(2) = E(X /Ү) + Е(Х)/Е(Ү), 


excepto en circunstancias muy especiales. 

El material dado por los teoremas 4.5 a 4.9 y los diversos corolarios son sumamente 
útiles, ya que no hay restricciones sobre la forma de la densidad o las funciones de pro- 
babilidad, aparte de la propiedad de independencia cuando ésta se requiere, como en los 
corolarios posteriores al teorema 4.9. Para ilustrar considere el ejemplo 4.23; la varianza 
de Z = 3X — 2Y + 5 no requiere restricciones en las distribuciones de las cantidades X 
y Y de los dos tipos de impurezas. Sólo se requiere la independencia entre X y Y. Por 
consiguiente, disponemos de la capacidad de calcular Maca Y 02 x) Para cualquier fun- 
ción g(-) a partir de los principios iniciales establecidos en los teoremas 4.1 y 4.3, donde 
se supone que se conoce la distribución f(x) correspondiente. Los ejercicios 4.40, 4.41 
y 4.42, entre otros, ilustran el uso de tales teoremas. De modo que, si g(x) es una fun- 
ción no lineal y se conoce la función de densidad (o función de probabilidad en el caso 
discreto), Mco Y o x) pueden evaluarse con exactitud. No obstante, como en el caso de 
las reglas dadas para combinaciones lineales, ¿habría reglas para funciones no lineales 
que se puedan utilizar cuando no se conoce la forma de la distribución de las variables 
aleatorias pertinentes? 

En general, suponga que X es una variable aleatoria y que Y = g(x). La solución 
general рага E(Y) o Var(Y) puede ser difícil y depende de la complejidad de la función 
g(-). Sin embargo, hay aproximaciones diponibles que dependen de una aproximación 
lineal de la función g(x). Por ejemplo, suponga que denotamos E(X) como и y Var(X) = 
ох. Entonces, una aproximación a las series de Taylor de g(x) alrededor de X = Hda 


Og(x) (х) (х — и)? 
(х) = #0) + тэх тея (х — рк) + qe loa > 


Como resultado, si truncamos después el término lineal y tomamos el valor esperado 
de ambos lados, obtenemos Elg(X)] ~ g(u,), que ciertamente es intuitivo y en algunos 
casos ofrece una aproximación razonable. No obstante, si incluimos el término de se- 
gundo orden de la serie de Taylor, entonces tenemos un ajuste de segundo orden para 
esta aproximación de primer orden como sigue: 


Aproximación de Ф с? 
Е[вОО] Ele(X)] = (и) + 80 > 


х=һНу 


Ejemplo 4.24: | Dada la variable aleatoria X con media u, y varianza сз, determine la aproximación de 
segundo orden para Е(е*). 


Solución: Como 8e =e' y 2 = ех, obtenemos Е (е) = el* (1 + 02/2). И | 


De manera similar, podemos desarrollar una aproximación para Var[g(x)] tomando 
la varianza de ambos lados de la expansión de la serie de Taylor de primer orden de g(x). 


Aproximación de 
Var[g(0)] Var[g(X )] = | 


dex) 1? с? 
Ox x*=Hx Е 


Ејетріо 4.25: | Dada la variable aleatoria Х, сото en el ejemplo 4.24, determine una fórmula aproxima- 
da рага Var[g(x)]. 
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Solución: De nuevo, gL = е“ por lo tanto, Var(X) = е2их o? . И | 
Estas aproximaciones se pueden extender a las funciones no lineales de más de una 
variable aleatoria. 
Dado un conjunto de variables aleatorias independientes X, X,,..., X, con medias ш, 
и»... U, у Varianzas са. 02. respectivamente, sea 


Y =h(X¡,X>,...,X k) 


una función no lineal; entonces tenemos las siguientes aproximaciones para E(Y) у 


Var(Y): 
Oh(X1,X2,..., Xk 
E(Y) = hp la. a | a El | 
¡=1 2 х= ш, 15150 
E Oh(x1,x xk) 5 
м | ЕАС ШАРДЫ. | o. 
= оп х=ш, 1<ї<К 


Ejemplo 4.26: | Сози dos variables aleatorias independientes X у Z, con medias и„ и, у varianzas 
с? y aż, respectivamente. Considere una variable aleatoria 


Y = Х/ 7. 
Determine aproximaciones para E(Y) у O 
Solución: Para E(Y), debemos usar ду = ! y 27 = — 5. Por consiguiente, 
y Py 2x 


T У 22 z 


Como resultado, 2 


Е(Үу= + 02 = (1+2), 


у la aproximación рага la varianza de Y está dada por 


1 w 2 1 „1% 2 
пе py (0 o) 


Var(Y) = T 
Hz 7 


4.4 Teorema de Chebyshev 


En la sección 4.2 establecimos que la varianza de una variable aleatoria nos dice algo 
acerca de la variabilidad de las observaciones con respecto a la media. Si una variable 
aleatoria tiene una varianza o desviación estándar pequeña, esperaríamos que la mayoría 
de los valores se agrupen alrededor de la media. Por lo tanto, la probabilidad de que una 
variable aleatoria tome un valor dentro de cierto intervalo alrededor de la media es ma- 
yor que para una variable aleatoria similar con una desviación estándar mayor. Si pensa- 
mos en la probabilidad en términos de área, esperaríamos una distribución continua con 
un valor grande de т para indicar una variabilidad mayor у, por lo tanto, esperaríamos 
que el área esté más extendida, como en la figura 4.2(a). Una distribución con una des- 
viación estándar pequeña debería tener la mayor parte de su área cercana a u, como en 
la figura 4.2(b). 
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4 
(a) (b) 


Figura 4.2: Variabilidad de observaciones continuas alrededor de la media. 


и 7 
(а) (b) 


Figura 4.3: Variabilidad de observaciones discretas alrededor de la media. 


Podemos argumentar lo mismo para una distribución discreta. En el histograma de 
probabilidad de la figura 4.3(b) el área se extiende mucho más que en la figura 4.3(a), lo 
cual indica una distribución más variable de mediciones o resultados. 

El matemático ruso P. L. Chebyshev (1821-1894) descubrió que la fracción del área 
entre cualesquiera dos valores simétricos alrededor de la media está relacionada con la 
desviación estándar. Como el área bajo una curva de distribución de probabilidad, o la de 
un histograma de probabilidad, suma 1, el área entre cualesquiera dos números es la pro- 
babilidad de que la variable aleatoria tome un valor entre estos números. 

El siguiente teorema, planteado por Chebyshev, ofrece una estimación conservadora 
de la probabilidad de que una variable aleatoria tome un valor dentro de k desviaciones 
estándar de su media para cualquier número real k. 


Ejercicios 


Teorema 4.10: 
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(Teorema de Chebyshev) La probabilidad de que cualquier variable aleatoria X tome 
un valor dentro de k desviaciones estándar de la media es de al menos 1 — 1/k?. Es decir, 


1 
P(p=k0<X <p+ko)>=1=>33. 


Para k = 2 el teorema establece que la variable aleatoria X tiene una probabilidad 
de al menos 1—1/2? = 3/4 de caer dentro de dos desviaciones estándar a partir de la me- 
dia; es decir, que tres cuartas partes o más de las observaciones de cualquier distribución 
se localizan en el intervalo и + 20. De manera similar, el teorema afirma que al menos 
ocho novenos de las observaciones de cualquier distribución caen en el intervalo 4 + 30. 


Ejemplo 4.27: | Una variable aleatoria X tiene una media и = 8, una varianza o° = 9 y una distribución 


Solución: 


Ejercicios 


de probabilidad desconocida. Calcule 

a) P(—4 < X < 20), 

b) РХ —8| > 6). 

а) P(—4 < X <20) = Р[8 – (4)(3) <Х < 8 + (4)(3)]| > Б. 

b) Р(|Х– 812 6) = 1-Р(|Х –- 81 < 6) =1-—P(-6<X –8 < 6) 


= 1—Р[8— (2)(3) < X < 8 + (2)(3)] < A 
4 Jl 
El teorema de Chebyshev tiene validez para cualquier distribución de observacio- 
nes, por lo cual los resultados generalmente son débiles. El valor que proporciona el 
teorema es sólo un límite inferior, es decir, sabemos que la probabilidad de una variable 
aleatoria que cae dentro de dos desviaciones estándar de la media no puede ser menor 
que 3/4, pero nunca sabemos cuánto podría ser en realidad. Sólo cuando conocemos la 
distribución de probabilidad podemos determinar probabilidades exactas. Por esta razón 
llamamos al teorema resultado de distribución libre. Cuando se supongan distribucio- 
nes específicas, como ocurrirá en los siguientes capítulos, los resultados serán menos 
conservadores. El uso del teorema de Chebyshev se restringe a situaciones donde se 
desconoce la forma de la distribución. 


4.53 Remítase al ejercicio 4.35 de la página 127 y 
calcule la media y la varianza de la variable aleatoria 
discreta Z = ЗХ — 2, donde X representa el número de 
errores por 100 líneas de código. 


4.54 Use el teorema 4.5 y el corolario 4.6 рага calcu- 
lar la media y la varianza de la variable aleatoria Z = 
5X + 3, donde X tiene la distribución de probabilidad 
del ejercicio 4.36 de la página 127. 


4.55 Suponga que una tienda de abarrotes compra 
5 envases de leche descremada al precio de mayoreo 
de $1.20 por envase y la vende a $1.65 por envase. 
Después de la fecha de caducidad, la leche que no se 
vende se retira de los anaqueles y el tendero recibe un 
crédito del distribuidor igual a tres cuartas partes del 


precio de mayoreo. Si la distribución de probabilidad 
de la variable aleatoria es X y el número de envases que 
se venden de este lote es 

x | o 1 2 3 4 5 


T 2 3 4 3 
f(x) | 15 15 15 15 15 15 


calcule la utilidad esperada. 


4.56 Repita el ejercicio 4.43 de la página 127 apli- 
cando el teorema 4.5 y el corolario 4.6. 


4.57 Sea X una variable aleatoria con la siguiente dis- 
tribución de probabilidad: 

x |-3 6 

O a 


viejo 
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Calcule E(X) y E(X?) y luego utilice estos valores para 
evaluar E[QX + 1]. 


4.58 El tiempo total que una adolescente utiliza su 
secadora de pelo durante un año, medido en unidades 
de 100 horas, es una variable aleatoria continua X que 
tiene la siguiente función de densidad 


Хх, 0O<x<l, 
f(x)=4 2-x 1l<x<2, 
0, еп оїго са$о. 


Utilice el teorema 4.6 para evaluar la media de la va- 
riable aleatoria Y = 60X? + 39X, donde Y es igual al 
número de kilowatts-hora que gasta al año. 


4.59 Si una variable aleatoria X se define de manera 
que 

EX – 1)]=10 y E[X —2)°] =6, 
calcule и y o°. 


4.60 Suponga que X y Y son variables aleatorias in- 
dependientes que tienen la siguiente distribución de 
probabilidad conjunta 


E _ 
fœy | 2 4 
1 |0.10 0.15 
y| 3 | 0.20 0.30 
5 [0.10 0.15 
Calcule 
a) EQX —3Y); 
b) E(XY). 


4.61 Use el teorema 4.7 para evaluar E(2XY? — X?Y) 
en la distribución de probabilidad conjunta que se 
muestra en la tabla 3.1 de la página 96. 


4.62 Si Ху Y son variables aleatorias independientes 
con varianzas сў= 5у оў = 3, calcule la varianza de 
la variable aleatoria Z = -2X + 4Y - 3. 


4.63 Repita el ejercicio 4.62 si X y Y no son indepen- 
dientes y с, = 1 


4.64 Suponga que X y Y son variables aleatorias inde- 
pendientes con densidades de probabilidad y 


a= £, x>2, 
S= 0, en otro caso, 
y 
пру 2y, 0 <у< 1, 
у= 0, en otro caso. 


Calcule el valor esperado de Z = XY. 
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4.65 Sea X el número que resulta cuando se lanza un 
dado rojo y Y el número que resulta cuando se lanza 
un dado verde. Calcule 


a) E(X +Y); 
b) E(X —Y); 
c) E(XY). 


4.66 Sea X el número que resulta cuando se lanza un 
dado verde y Y el número que resulta cuando se lanza 
un dado rojo. Calcule la varianza de la variable alea- 
toria 


а) 2X —Y; 
b) X +3Y —5, 


4.67 Sila función de densidad conjunta de X y Y está 
dada por 


2 
70 +2у), 0<x<1l,1<y<2, 

= 7 ` 

FG у) = |, en otro caso, 


calcule el valor esperado de g(X, Y) = + XT, 


4.68 Se sabe que la potencia P en watts que se disipa 
en un circuito eléctrico con resistencia R está dada por 
P = PR, donde 7 es la corriente en amperes y R es 
una constante fija en 50 ohms. Sin embargo, / es una 
variable aleatoria con и, = 15 amperes y o? = 0.03 
amperes?. Dé aproximaciones numéricas a la media y a 
la varianza de la potencia P. 


4.69 Considere el ejercicio de repaso 3.77 de la pá- 
gina 108. Las variables aleatorias X y Y representan el 
número de vehículos que llegan a dos esquinas de ca- 
lles separadas durante cierto periodo de 2 minutos en el 
día. La distribución conjunta es 


1 9 
fx y) = (==) (5) > 


рагах = 0, 1, 2 y y =0, 1, 2,... 


a) Determine E(X), E(Y), Var(X) y Var(V). 
b) Considere que Z = X + Y es la suma de ambas. 
Calcule E(Z) y Var(Z). 


4.70 Considere el ejercicio de repaso 3.64 de la 
página 107. Hay dos líneas de servicio. Las variables 
aleatorias X y Y son las proporciones del tiempo que la 
línea 1 y la línea 2 están en funcionamiento, respecti- 
vamente. La función de densidad de probabilidad con- 
junta para (X, Y) está dada por 


3,2 2 
_ Јо? +у?), O<x y<l, 
f(x, y) = |. еп otro caso. 


a) Determine si X y Y son independientes o no. 


Ejercicios de repaso 


b) Se tiene interés por saber algo acerca de la propor- 
ción de Z = X + Y, la suma de las dos proporcio- 
nes. Calcule E(X + Y). También calcule E(XY). 

c) Calcule Var(X), Var(Y) y Cov(X, Y). 

d) Calcule Var(X + Y). 


4.71 El periodo Y en minutos que se requiere para ge- 
nerar un reflejo humano ante el gas lacrimógeno tiene 
la siguiente función de densidad 
= О<у< œ 
= 4 = j 
fO) | en otro caso. 


a) ¿Cuál es el tiempo medio para el reflejo? 
b) Calcule E(Y?) y Var(Y). 


4.72 Una empresa industrial desarrolló una máquina 
de limpiar alfombras con buen rendimiento de com- 
bustible porque limpia más superficie de alfombra en 
menos tiempo. Se tiene interés por una variable aleato- 
ria Y, la cantidad en galones por minuto que ofrece. Se 
sabe que la función de densidad está dada por 


го) = 1 олы 


еп otro caso. 
a) Determine la función de densidad. 
b) Calcule E(Y), Е(Ү?) у Var(Y). 
4.73 Рага la situación del ejercicio 4.72 calcule E(e”) 
utilizando el teorema 4.1, es decir, mediante el uso de 


8 
Е(е) = [er 
7 


Luego, calcule £(e”) sin utilizar f(y). En su lugar utilice 
el ajuste de segundo orden para la aproximación de pri- 
mer orden de K(e”). Comente al respecto. 


4.74 Considere nuevamente la situación del ejerci- 
cio 4.72, donde se le pide calcular Var(e”). Utilice los 
teoremas 4.2 y 4.3 y defina Z = e”. En consecuencia, 
utilice las condiciones del ejercicio 4.73 para calcular 


Var (Z) = E(Z?) — [E (Z). 


Ejercicios de repaso 


4.79 Demuestre el teorema de Chebyshev. 
4.80 Calcule la covarianza de las variables aleatorias 


X y Y que tienen la siguiente función de densidad de 
probabilidad conjunta 


x+y, 0<х<1, 0<у<1, 
0, еп otro caso. 


7®»={ 
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Luego hágalo sin utilizar f(y). En su lugar utilice la 
aproximación de primer orden a las series de Taylor 
para Var(e*). ¡Comente al respecto! 


4.75 Una empresa eléctrica fabrica una bombilla de 
luz de 100 watts que, de acuerdo con las especifica- 
ciones escritas en la caja, tiene una vida media de 900 
horas con una desviación estándar de 50 horas. A lo 
sumo, ¿qué porcentaje de las bombillas no duran al 
menos 700 horas? Suponga que la distribución es simé- 
trica alrededor de la media. 


4.76 Еп una planta de ensamble automotriz se crean 
70 nuevos puestos de trabajo y se presentan 1000 as- 
pirantes. Para seleccionar entre los aspirantes a los 70 
mejores la armadora aplica un examen que abarca habi- 
lidad mecánica, destreza manual y capacidad matemá- 
tica. La calificación media de este examen resulta ser 
60 y las calificaciones tienen una desviación estándar 
de 6. ¿Una persona que obtiene una calificación de 84 
puede obtener uno de los puestos? [Sugerencia: Utilice 
el teorema de Chebyshev]. Suponga que la distribución 
es simétrica alrededor de la media. 


4.77 Una variable aleatoria X tiene una media и = 10 
y una varianza 0? = 4. Utilice el teorema de Chebyshev 
para calcular 


а) P(|X – 10| > 3); 

b) Р(Х — 10| < 3); 

c) P(5< X <15); 

d) el valor de la constante c tal que 
Р(|Х — 10| >с) < 0.04. 


4.78 Calcule P(u — 20 < X < u + 20), donde X tiene 
la siguiente función de densidad 


= 


y compare con el resultado dado рог el teorema de 
Chebyshev. 


0O<x<l, 
en otro caso, 


4.81 Remítase a las variables aleatorias cuya función 
de densidad de probabilidad conjunta está dada en el 
ejercicio 3.47 de la página 105 y calcule la cantidad 
promedio de queroseno que queda en el tanque al final 
del día. 


4.82 Suponga que la duración X en minutos de un 
tipo específico de conversación telefónica es una varia- 
ble aleatoria con función de densidad de probabilidad 
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x>0, 
en otro caso. 


a) Determine la duración media E(X) de este tipo de 
conversación telefónica. 
b) Calcule la varianza y la desviación estándar de X. 
c) Calcule Е[(Х + 57]. 
4.83 Remítase a las variables aleatorias cuya fun- 
ción de densidad conjunta está dada en el ejercicio 
3.41 de la página 105 y calcule la covarianza entre el 
peso de las cremas y el peso de los chiclosos en estas 
cajas de chocolates. 
4.84 Remítase a las variables aleatorias cuya función 
de densidad de probabilidad conjunta está dada en el 
ejercicio 3.41 de la página 105 y calcule el peso espe- 
rado para la suma de las cremas y los chiclosos si uno 
compra una caja de tales chocolates. 
4.85 Suponga que se sabe que la vida de un compre- 
sor particular X, en horas, tiene la siguiente función de 
densidad 
1_„—Х/ 900 


го) (e , x>0, 


0, еп оїго са$о. 


a) Calcule la vida media del compresor. 

b) Calcule Е(Х?). 

c) Calcule la varianza y la desviación estándar de la 

variable aleatoria X. 

4.86 Remítase a las variables aleatorias cuya función 
de densidad conjunta está dada en el ejercicio 3.40 de 
la página 105, 

a) calcule u, y 4y 

b) calcule E[(X + Y)/2]. 
4.87 Demuestre que Cov(aX, bY) = ab Cov(X, Y). 
4.88 Considere la función de densidad del ejercicio de 
repaso 4.85. Demuestre que el teorema de Chebyshev 
es válido para k = 2 y k = 3. 
4.89 Considere la siguiente función de densidad con- 
junta 


jaye 2, x>2,0<y<1, 
+ 0, en otro caso. 


Calcule el coeficiente de correlación p,,,. 
4.90 Considere las variables aleatorias X y Y del ejer- 
cicio 4.63 de la página 138. Calcule p, 
4.91 La utilidad de un distribuidor, en unidades de 
$5000, por un automóvil nuevo es una variable aleato- 
ria X que tiene la siguiente función de densidad 
2(1—x), O<x<l, 
fœ) = | en otro caso. 
a) Calcule la varianza de la utilidad del distribuidor. 
b) Demuestre que el teorema de Chebyshev es válido 
para k = 2 con la función de densidad anterior. 
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с) ¿Cuál es la probabilidad de que la utilidad exceda 
$500? 


4.92 Considere el ejercicio 4.10 de la página 117. ¿Se 
puede decir que las calificaciones dadas por los dos ex- 
pertos son independientes? Explique su respuesta. 


4.93 Los departamentos de marketing y de contabi- 
lidad de una empresa determinaron que si la empresa 
comercializa su producto creado recientemente, su 
contribución a las utilidades de la empresa durante los 
próximos 6 meses será la siguiente: 


Contribución a las utilidades Probabilidad 


—$5,000 0.2 
$10,000 0.5 
$30,000 0.3 


¿Cuál es la utilidad esperada de la empresa? 


4.94 Еп un sistema de apoyo para el programa espa- 
cial estadounidense, un componente crucial único fun- 
ciona sólo 85 por ciento del tiempo. Para aumentar la 
confiabilidad del sistema se decidió instalar tres com- 
ponentes paralelos, de manera que el sistema falle sólo 
si todos fallan. Suponga que los componentes actúan 
de forma independiente y que son equivalentes en el 
sentido de que 3 de ellos tienen una tasa de éxito de 85 
por ciento. Considere la variable aleatoria X como el 
número de componentes de cada tres que fallan. 
a) Escriba una función de probabilidad para la varia- 
ble aleatoria X. 
b) ¿Cuál es E(X) (es decir, el número medio de com- 
ponentes de cada tres que fallan)? 
c) ¿Cuál es Var(X)? 
d) ¿Cuál es la probabilidad de que el sistema com- 
pleto sea exitoso? 
e) ¿Cuál es la probabilidad de que falle el sistema? 
f) Si se desea que el sistema tenga una probabilidad 
de éxito de 0.99, ¿son suficientes los tres compo- 
nentes? Si no lo son, ¿cuántos se requerirían? 


4.95 En los negocios es importante planear y llevar 
a cabo investigación para anticipar lo que ocurrirá al 
final del año. La investigación sugiere que el espectro 
de utilidades (pérdidas) de cierta empresa, con sus res- 
pectivas probabilidades, es el siguiente: 


Utilidad Probabilidad 


—$15, 000 0.05 
$0 0.15 
$15,000 0.15 
$25,000 0.30 
$40,000 0.15 
$50,000 0.10 
$100,000 0.05 
$150,000 0.03 
$200,000 0.02 


Ejercicios de repaso 


a) ¿Cuál es la utilidad esperada? 
b) Determine la desviación estándar de las utilidades. 


4.96 Mediante un conjunto de datos, y por la amplia 
investigación, se sabe que la cantidad de tiempo que 
cierto empleado de una empresa llega tarde a trabajar, 
medido en segundos, es una variable aleatoria X con la 
siguiente función de densidad 


3 2 2 
Ne [e (50? — x°), —50<х < 50, 
0, en otro caso. 
En otras palabras, él no sólo llega ligeramente retra- 
sado a veces, sino que también puede llegar temprano 
a trabajar. 
a) Calcule el valor esperado del tiempo en segundos 
que llega tarde. 
b) Calcule E(X?). 
с) ¿Cuál es la desviación estándar del tiempo en que 
llega tarde? 


4.97 Un camión de carga viaja desde el punto A hasta 
el punto B y regresa por la misma ruta diariamente. Hay 
cuatro semáforos en la ruta. Sea X, el número de semá- 
foros en rojo que el camión encuentra cuando va de A 
a B y X, el número de los que encuentra en el viaje de 
regreso. Los datos recabados durante un periodo largo 
sugieren que la distribución de probabilidad conjunta 
рага (Х,, X,) está dada por 


X2 
Р 0 1 2 3 4 
0 001 001 003 007 001 
1 003 005 008 003 002 
2 003 011 015 001 001 
з 002 007 010 003 001 
4 001 006 003 001 001 


а) Determine la densidad marginal de X.. 

b) Determine la densidad marginal de X,. 

c) Determine la distribución de densidad condicional 
de X, dado que X, = 3. 

d) Determine E(X). 

e) Determine Е(Х.). 

f) Determine E(X IX, = 3). 

g) Determine la desviación estándar de Х,. 


4.98 Una tienda de abarrotes tiene dos sitios sepa- 
rados en sus instalaciones donde los clientes pueden 
pagar cuando se marchan. Estos dos lugares tienen dos 
cajas registradoras y dos empleados que atienden a los 
clientes que van a pagar. Sea X el número de la caja 
registradora que se utiliza en un momento específico 
en el sitio 1 y Y el número de la caja registradora que se 
utiliza en el mismo momento en el sitio 2. La función 
de probabilidad conjunta está dada por 
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y 
X 0 1 2 
0 012 004 004 
1 008 019 005 
2 006 012 030 


a) Determine la densidad marginal de X y de Y, así 
como la distribución de probabilidad de X, dado 
que Y = 2. 

b) Determine E(X) y Var(X). 

c) Determine Е(Х1Ү = 2) y Var(XIY = 2). 


4.99 Considere un transbordador que puede llevar 
tanto autobuses como automóviles en un recorrido a tra- 
vés de una vía fluvial. Cada viaje cuesta al propietario 
aproximadamente $10. La tarifa por automóvil es de 
$3 y por autobús es de $8. Sean X y Y el número de au- 
tobuses y automóviles, respectivamente, que se trans- 
portan en un viaje específico. La distribución conjunta 
de X y Y está dada por 


X 

y 0 1 2 

0 001 001 003 
1 003 008 007 
2 003 006 006 
з 007 007 013 
4 012 004 003 
5 008 006 002 


Calcule la utilidad esperada para el viaje del transbor- 
dador. 


4.100 Como veremos en el capítulo 12, los métodos 
estadísticos asociados con los modelos lineal y no li- 
neal son muy importantes. De hecho, a menudo las fun- 
ciones exponenciales se utilizan en una amplia gama 
de problemas científicos y de ingeniería. Considere 
un modelo que se ajusta a un conjunto de datos que 
implica los valores medidos k, y k,, y una respuesta 
específica Y a las mediciones. El modelo postulado es 


Y = еро thiki+bak2 


> 


donde Y denota el valor estimado de Y. , k, y k, son 
valores fijos y b,, b, y b, son estimados de constantes y, 
por lo tanto, variables aleatorias. Suponga que tales va- 
riables aleatorias son independientes y use la fórmula 
aproximada para la varianza de una función no lineal 
de más de una variable. Dé una expresión para Var(Y). 
Suponga que se conocen las medias de Б, b, y b, y que 
son B,, 8, y B y también suponga que se conocen las 
varianzas de b,, b, y b, y que son то, Сту 03: 
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4.101 Considere el ejercicio de repaso 3.73 de la pá- 
gina 108, el cual implica Y, la proporción de impurezas 
en un lote, donde la función de densidad está dada por 


уо 
o=" у, O<y<l, 


0, en otro caso. 


a) Calcule el porcentaje esperado de impurezas. 
b) Calcule el valor esperado de la proporción de la 
calidad del material (es decir, calcule Е(1 — Y)). 


Capítulo 4 Esperanza matemática 


c) Calcule la varianza de la variable aleatoria Z = 
1-Y. 
4.102 Proyecto: Sea X = número de horas que cada 
estudiante del grupo durmió la noche anterior. Cree una 
variable discreta utilizando los siguientes intervalos 
arbitrarios: 


X<3,3<X<6,6<X<9yX>09. 


a) Estime la distribución de probabilidad para X. 
b) Calcule la media estimada y la varianza para X. 


4.5 Posibles riesgos y errores conceptuales; relación 
con el material de otros capítulos 


El material que se cubrió en este capítulo es fundamental, como el contenido del capítulo 
3. Mientras que en el capítulo 3 nos concentramos en las características generales de una 
distribución de probabilidad, en el presente capítulo definimos cantidades importantes o 
parámetros que caracterizan la naturaleza general del sistema. La media de una distri- 
bución refleja una tendencia central, en tanto que la varianza o la desviación estándar 
reflejan variabilidad en el sistema. Además, la covarianza refleja la tendencia de dos va- 
riables aleatorias a “moverse juntas” en un sistema. Estos importantes parámetros serán 
fundamentales en el estudio de los siguientes capítulos. 

El lector debería comprender que el tipo de distribución a menudo está determinado 
por el contexto científico. Sin embargo, los valores del parámetro necesitan estimarse a 
partir de datos científicos. Por ejemplo, en el caso del ejercicio de repaso 4.85 el fabri- 
cante del compresor podría saber (material que se presentará en el capítulo 6), por su 
experiencia y conocimiento del tipo de compresor, que la naturaleza de la distribución es 
como se indica en el ejercicio. Pero la media u = 900 se estimaría a partir de la expe- 
rimentación con la máquina. Aunque aquí se da por conocido el valor del parámetro de 
900, en situaciones reales eso no ocurrirá sin el uso de datos experimentales. El capítulo 


9 se dedica a la estimación. 


Capítulo 5 


Algunas distribuciones 
de probabilidad discreta 


5.1 Introducción y motivación 


La distribución de probabilidad discreta describe el comportamiento de una variable 
aleatoria, independientemente de si se representa de forma gráfica o mediante un histo- 
grama, en forma tabular o con una fórmula. A menudo las observaciones que se generan 
mediante diferentes experimentos estadísticos tienen el mismo tipo general de compor- 
tamiento. En consecuencia, las variables aleatorias discretas asociadas con estos ехреп- 
mentos se pueden describir esencialmente con la misma distribución de probabilidad y, 
por lo tanto, es posible representarlas usando una sola fórmula. De hecho, se necesitan 
sólo unas cuantas distribuciones de probabilidad importantes para describir muchas de 
las variables aleatorias discretas que se encuentran en la práctica. 

Este conjunto de distribuciones en realidad describe varios fenómenos aleatorios 
de la vida real. Por ejemplo, en un estudio en el que se probó la eficacia de un nuevo 
fármaco, de todos los pacientes que lo utilizaron, el número de pacientes que se curaron 
se aproximó a una distribución binomial (sección 5.2). En un ejemplo en una industria, 
cuando se prueba una muestra de artículos seleccionados de un lote de producción, el nú- 
mero de productos defectuosos en la muestra por lo general se puede representar como 
una variable aleatoria hipergeométrica (sección 5.3). En un problema estadístico de con- 
trol de calidad el experimentador señalará un cambio en la media del proceso cuando los 
datos observacionales excedan ciertos límites. El número de muestras requeridas para ge- 
nerar una falsa alarma sigue una distribución geométrica, que es un caso especial de dis- 
tribución binomial negativa (sección 5.4). Por otro lado, el número de leucocitos de 
una cantidad fija de una muestra de la sangre de un individuo suele ser aleatorio y podría 
describirse mediante una distribución de Poisson (sección 5.5). En este capítulo se pre- 
sentarán esas distribuciones de uso común con varios ejemplos. 


5.2 Distribuciones binomial y multinomial 


Con frecuencia un experimento consta de pruebas repetidas, cada una con dos resultados 
posibles que se pueden denominar éxito o fracaso. La aplicación más evidente tiene que 
ver con la prueba de artículos a medida que salen de una línea de ensamble, donde cada 
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prueba o experimento puede indicar si un artículo está o no defectuoso. Podemos elegir 
definir cualquiera de los resultados como éxito. El proceso se conoce como proceso 
de Bernoulli y cada ensayo se denomina experimento de Bernoulli. Por ejemplo, si 
extraemos cartas de una baraja y éstas no se reemplazan, cambian las probabilidades 
en la repetición de cada ensayo; es decir, la probabilidad de seleccionar una carta de 
corazones en la primera extracción es 1/4, pero en la segunda es una probabilidad con- 
dicional que tiene un valor de 13/51 o 12/51, dependiendo de si resulta un corazón en la 
primera extracción; entonces éste ya no sería considerado un conjunto de experimentos 
de Bernoulli. 


El proceso de Bernoulli 
En términos estrictos el proceso de Bernoulli se caracteriza por lo siguiente: 


1. El experimento consta de ensayos repetidos. 
2. Cada ensayo produce un resultado que se puede clasificar como éxito o fracaso. 


3. La probabilidad de un éxito, que se denota con p, permanece constante de un en- 
sayo a otro. 


4. Los ensayos repetidos son independientes. 


Considere el conjunto de experimentos de Bernoulli en el que se seleccionan tres 
artículos al azar de un proceso de producción, luego se inspeccionan y se clasifican co- 
mo defectuosos o no defectuosos. Un artículo defectuoso se designa como un éxito. El 
número de éxitos es una variable aleatoria X que toma valores integrales de cero a 3. Los 
ocho resultados posibles y los valores correspondientes de X son 


Resultado | NNN NDN NND DNN NDD DND DDN DDD 
x 0 1 1 1 2 2 2 3 


Сото los artículos se seleccionan de forma independiente y se asume que el pro- 
ceso produce 25% de artículos defectuosos, 


3 1 3 9 
P(NDN) = P(N)P(D)P (N) =( ) ( ) ( ) = 


4)L4)14) 64 


Cálculos similares dan las probabilidades para los otros resultados posibles. La distribu- 
ción de probabilidad de X es, por lo tanto, 


e |o ї 2 3 


27 27 9 1 
fol бё чє 64 


Distribución binomial 


El número X de éxitos en n experimentos de Bernoulli se denomina variable aleatoria 
binomial. La distribución de probabilidad de esta variable aleatoria discreta se llama 
distribución binomial y sus valores se denotarán como b(x; п, р), ya que dependen del 
número de ensayos y de la probabilidad de éxito en un ensayo dado. Por consiguiente, 
para la distribución de probabilidad de X el número de productos defectuosos es 


9 


1 
Р(Х =2=f0)= p (253, 5) = 2. 
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Generalicemos ahora la ilustración anterior con el fin de obtener una fórmula para 
b(x; n, p). Esto significa que deseamos encontrar una fórmula que dé la probabilidad de 
x éxitos en n ensayos para un experimento binomial. Empiece por considerar la probabi- 
lidad de x éxitos y n – x fracasos en un orden específico. Como los ensayos son indepen- 
dientes, podemos multiplicar todas las probabilidades que corresponden a los diferentes 
resultados. Cada éxito ocurre con probabilidad p y cada fracaso con probabilidad q = 
1 — p. Por lo tanto, la probabilidad para el orden específico es p'g””. Ahora debemos 
determinar el número total de puntos muestrales en el experimento que tienen x éxitos y 
n — x fracasos. Este número es igual al número de particiones de n resultados en dos gru- 
pos con x en un grupo y n — x en el otro, y se escribe (") como se presentó en la sección 
2.3. Como estas particiones son mutuamente excluyentes, sumamos las probabilidades 
de todas las diferentes particiones para obtener la fórmula general o simplemente mul- 
tiplicamos p'g”” por ( ) ; 


п 
Xx 


Distribución Un experimiento de Bernoulli puede tener como resultado un éxito con probabilidad p 
binomial y un fracaso con probabilidad q = 1 — p. Entonces, la distribución de probabilidad de la 
variable aleatoria binomial X, el número de éxitos en n ensayos independientes, es 


b(x; n, p) = (прат, ОЛ: 


Observe que cuando и = 3 ур = 1/4, la distribución de probabilidad de Х, el número de 
artículos defectuosos, se escribe como 


1 PIENSA 
o) asas 


en vez de la forma tabular de la página 144. 


Ejemplo 5.1: |La probabilidad de que cierta clase de componente sobreviva a una prueba de choque es 
de 3/4. Calcule la probabilidad de que sobrevivan exactamente 2 de los siguientes 4 
componentes que se prueben. 

Solución: Si suponemos que las pruebas son independientes y p = 3/4 para cada una de las 4 prue- 
bas, obtenemos 


4) (0) 0) 0) -aG a 


¿De dónde proviene el nombre binomial? 


La distribución binomial deriva su nombre del hecho de que los n + 1 términos en la 
expansión binomial de (q + р)" corresponden а los diversos valores de b(x; n, p) para 
x=0,1,2,...,n. Es decir, 


(q+p) = (5)7 + (pe + jr ++ (r 


= (0; n, p) + b(1; n, p) + b(2; n, p) + ++- + b(n; n, p). 
Dado que p + q = 1, vemos que 


a n,p)= 1, 
x=0 


una condición que se debe cumplir para cualquier distribución de probabilidad. 


146 Capítulo 5 Algunas distribuciones de probabilidad discreta 


Con frecuencia nos interesamos en problemas donde se necesita obtener P(X < r) o 
Р(а < X < b). Las sumatorias binomiales 


B (r; n, p) = У b; n, p) 


x=0 


se presentan en la tabla A.1 del apéndice para n = 1, 2,..., 20, para valores seleccionados 
de р entre 0.1 y 0.9. Ilustramos el uso de la tabla А.І con el siguiente ejemplo. 


Ejemplo 5.2: [Та probabilidad de que un paciente se recupere de una rara enfermedad sanguínea es de 
0.4. Si se sabe que 15 personas contrajeron la enfermedad, ¿cuál es la probabilidad de que 
a) sobrevivan al menos 10, b) sobrevivan de 3 a 8, y c) sobrevivan exactamente 5? 
Solución: Sea X el número de personas que sobreviven. 
9 
a) P(X>10)=1-—P(X < 10) = 1 – У b(x,15, 0.4) = 1 — 0.9662 
x=0 
= 0.0338 
8 8 2 
b) P(B3<X<8)=) b(x;15, 0.4) = Y ba; 15, 0.4) – X` ba; 15, 0.4) 
x=3 x=0 x=0 
= 0.9050 — 0.0271 = 0.8779 
5 4 
с) Р(Х = 5) = Ь(5;15, 0.4) = У 'b(x; 15, 0.4) — У 7660; 15, 0.4) 
x=0 x=0 
= 0.4032 — 0.2173 = 0.1859 И | 


Ejemplo 5.3: | Una cadena grande de tiendas al detalle le compra cierto tipo de dispositivo electrónico 
a un fabricante, el cual le indica que la tasa de dispositivos defectuosos es de 3%. 


a) El inspector de la cadena elige 20 artículos al azar de un cargamento. ¿Cuál es la pro- 
babilidad de que haya al menos un artículo defectuoso entre estos 20? 


b) Suponga que el detallista recibe 10 cargamentos en un mes y que el inspector prueba 
aleatoriamente 20 dispositivos por cargamento. ¿Cuál es la probabilidad de que haya 
exactamente tres cargamentos que contengan al menos un dispositivo defectuoso de 
entre los 20 seleccionados y probados? 


Solución: a) Denote con X el número de dispositivos defectuosos de los 20. Entonces X sigue una 
distribución b(x; 20, 0.03). Por consiguiente, 


P(X>1)=1-P(X=0)= 1 — b (0; 20, 0.03) 
= 1 — (0.03)0(1 — 0.03)29—0 = 0.4562. 


b) En este caso cada cargamento puede o no contener al menos un artículo defectuoso. 
Por lo tanto, el hecho de probar el resultado de cada cargamento puede considerarse 
como un experimento de Bernoulli con p = 0.4562 del inciso a). Si suponemos la 
independencia de un cargamento a otro, y si se denotamos con Y el número de carga- 
mentos que contienen al menos un artículo defectuoso, Y sigue otra distribución bi- 
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nomial b(y; 10, 0.4562). Por lo tanto, 


1 
P(Y =3)= ( з) 0.45623 (1 — 0.4562)” = 0.1602. 


Areas de aplicación 


Teorema 5.1: 


Prueba: 


A partir de los ejemplos 5.1 a 5.3 debería quedar claro que la distribución binomial tiene 
aplicaciones en muchos campos científicos. Un ingeniero industrial está muy interesado 
en “la proporción de artículos defectuosos” en cierto proceso industrial. A menudo las 
medidas de control de calidad y los esquemas de muestreo para procesos se basan en 
la distribución binomial, la cual se aplica en cualquier situación industrial donde el re- 
sultado de un proceso es dicotómico y los resultados del proceso son independientes, y 
además la probabilidad de éxito se mantiene constante de una prueba a otra. La distribu- 
ción binomial también se utiliza mucho en aplicaciones médicas y militares. En ambos 
casos un resultado de éxito o de fracaso es importante. Por ejemplo, la importancia del 
trabajo farmacéutico radica en poder determinar si un determinado fármaco “cura” o “no 
cura”; mientras que si se está probando la eficacia al lanzar un proyectil el resultado se 
interpretaría como “dar en el blanco” o “fallar”. 

Сото la distribución de probabilidad de cualquier variable aleatoria binomial de- 
pende sólo de los valores que toman los parámetros n, p y q, parecería razonable suponer 
que la media y la varianza de una variable aleatoria binomial también dependen de los 
valores que toman tales parámetros. En realidad esto es cierto, y en la demostración del 
teorema 5.1 derivamos fórmulas generales que se pueden utilizar para calcular la media 
y la varianza de cualquier variable aleatoria binomial como funciones de n, p y q. 


La media y la varianza de la distribución binomial b(x; n, p) son 
И =np y 0? = пра. 


Representemos el resultado de la j-ésima prueba mediante una variable aleatoria de Ber- 
noulli 1, que toma los valores O y 1 con probabilidades q y p, respectivamente. Por lo 
tanto, en un experimento binomial el número de éxitos se escribe como la suma de las n 
variables indicadoras independientes. De aquí, 


X =h+h+ +1. 
La media de cualquier L es EQ) = (0(9) + (1)(р) = p. Por lo tanto, usando el corolario 
4.4 de la página 131, la media de la distribución binomial es 
p=E(X) = Е) +Е(5) +: +E(U,)=p+p+:::+p=np. 
Ep 
n términos 
La varianza de cualquier 1 es от, = EQ?) - р? =(0Y(q) + (19200) = р? = р(1-р) = рд. АІ 
ampliar el corolario 4.11 al caso de п variables de Bernoulli independientes, la varianza 
de la distribución binomial resulta como 
ох = 01, +01, +: +0), =рд+ра+- +pq = npa. 
A am 


n términos J 
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Ejemplo 5.4: | Se conjetura que hay impurezas en 30% del total de pozos de agua potable de cierta co- 


Solución: 


munidad rural. Para obtener información sobre la verdadera magnitud del problema se 
determina que debe realizarse algún tipo de prueba. Como es muy costoso probar todos 
los pozos del área, se eligen 10 al azar para someterlos a la prueba. 


a) Si se utiliza la distribución binomial, ¿cuál es la probabilidad de que exactamente 3 
pozos tengan impurezas, considerando que la conjetura es correcta? 


b) ¿Cuál es la probabilidad de que más de 3 pozos tengan impurezas? 


a) Requerimos 3 2 
b(3; 10, 0.3) = Y b(x; 10, 0.3) — 5 b(x; 10, 0.3) = 0.6496 — 0.3828 = 0.2668. 
x=0 x=0 
b) En este caso P(X > 3) = 1 — 0.6496 = 0.3504. | 


Ejemplo 5.5: | Calcule la media y la varianza de la variable aleatoria binomial del ejemplo 5.2 y des- 


Solución: 


pués utilice el teorema de Chebyshev (de la página 137) para interpretar el intervalo и + 
20. 

Como el ejemplo 5.2 fue un experimento binomial con n = 15 y p = 0.4, por el teorema 
5.1 tenemos 


u = (15)(0.4) = 6 y 0? = (15)(0.4)(0.6) = 3.6. 


Al tomar la raíz cuadrada de 3.6 encontramos que с = 1.897. Por lo tanto, el inter- 
valo que se requiere es б + (2)(1.897), o de 2.206 a 9.794. El teorema de Chebyshev 
establece que el número de pacientes recuperados, de un total de 15 que contrajeron la 
enfermedad, tiene una probabilidad de al menos 3/4 de caer entre 2.206 y 9.794 o, como 
los datos son discretos, incluso entre 2 y 10. JJ 

Hay soluciones en las que el cálculo de las probabilidades binomiales nos permiti- 
rían hacer inferencias científicas acerca de una población después de que se recaban los 
datos. El siguiente ejemplo es una ilustración de esto. 


Ejemplo 5.6: | Considere la situación del ejemplo 5.4. La idea de que el 30% de los pozos tienen impu- 


Solución: 


rezas es sólo una conjetura del consejo local del agua. Suponga que se eligen 10 pozos 
de forma aleatoria y resulta que 6 contienen impurezas. ¿Qué implica esto respecto de la 
conjetura? Utilice un enunciado de probabilidad. 

Primero debemos preguntar: “Si la conjetura es correcta, ¿podríamos haber encontrado 
6 o más pozos con impurezas?” 


10 5 
Р(Х > 6) = Y  b(x; 10, 0.3) —) | bG; 10, 0.3) = 1 — 0.9527 = 0.0473. 
x=0 x=0 


En consecuencia, es poco probable (4.7% de probabilidad) que se encontrara que 6 o 
más pozos contenían impurezas si sólo 30% de ellos las contienen. Esto pone seriamente 
en duda la conjetura y sugiere que el problema de la impureza es mucho más grave. _ЁЙ 

Como podrá darse cuenta el lector ahora, en muchas aplicaciones hay más de dos 
resultados posibles. Por ejemplo, en el campo de la genética el color de las crías de co- 
nejillos de Indias puede ser rojo, negro o blanco. Con frecuencia la dicotomía de “defec- 
tuoso” y “sin defectos” en casos de ingeniería es en realidad un simplificación excesiva. 
De hecho, a menudo hay más de dos categorías que caracterizan los artículos o las partes 
que salen de una línea de producción. 
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Experimentos multinomiales y la distribución multinomial 


El experimento binomial se convierte en un experimento multinomial si cada prueba 
tiene más de dos resultados posibles. La clasificación de un producto fabricado como 
ligero, pesado o aceptable, y el registro de los accidentes en cierto crucero de acuerdo 
con el día de la semana, constituyen experimentos multinomiales. Extraer con reem- 
plazo una carta de una baraja también es un experimento multinomial si los 4 palos son 
los resultados de interés. 

En general, si un ensayo dado puede tener como consecuencia cualquiera de los k 
resultados posibles Е, E,, ..., E, con probabilidades р, p,, ... , P, la distribución multi- 
nomial dará la probabilidad de que E, ocurra x, veces, E, ocurra x, veces... y E, ocurra x, 
veces en n ensayos independientes, donde 


X1+FXx2 +: хр = п. 
Denotaremos esta distribución de probabilidad conjunta como 


F(1,X2).-- Xk3P1,P2>--->Pk,M). 


Salta a la vista que p, + p, + = + p, = 1, pues el resultado de cada ensayo debe ser uno 
de los k resultados posibles. 

Para derivar la fórmula general procedemos como en el caso binomial. Puesto que 
los ensayos son independientes, cualquier orden especificado que produzca x, resultados 
para E, x, para E,,..., х, para E, ocurrirá con probabilidad p p? 59 р . El número 
total de ordenamientos que producen resultados similares para los n ensayos es igual 
al número de particiones de п artículos en k grupos con х, en el primer grupo, x, en el 
segundo grupo,..., у х, en el k-ésimo grupo. Esto se puede hacer en 


| п ) n! 
Ж. XD)... Xk x1!lx2!- «xp! 


formas. Como todas las particiones son mutuamente excluyentes y tienen la misma pro- 
babilidad de ocurrir, obtenemos la distribución multinomial multiplicando la probabili- 
dad para un orden específico por el número total de particiones. 


Distribución 
multinomial 


Si un ensayo dado puede producir los k resultados Е, E,,..., E, con probabilidades p, 
Pa» -+> р entonces la distribución de probabilidad de las variables aleatorias X p Xeo Xy 
que representa el número de ocurrencias para E, E,,..., E, en n ensayos independientes, 
es 


X k 


n : 
. — $ X2 д 
Х(х1,х2,...,х6;5р1,рә,..., рк,п) = (e Я а) opt, 
> PU 


con 


k k 
Y xi =n y Ур =l. 


isi ї=1 


La distribución multinomial deriva su nombre del hecho de que los términos de la 
expansión multinomial de (р, + p, + ... + р" corresponden a todos los posibles valores 
de f(x1,X%2,...»XE5P1>P25---» Pk"). 
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Ejemplo 5.7: |La complejidad de las llegadas y las salidas de los aviones en un aeropuerto es tal que a 
menudo se utiliza la simulación por computadora para modelar las condiciones “idea- 
les”. Para un aeropuerto específico que tiene tres pistas se sabe que, en el escenario ideal, 
las probabilidades de que las pistas individuales sean utilizadas por un avión comercial 
que llega aleatoriamente son las siguientes: 


Pista 1: р, = 2/9 

Pista 2: p, = 1/6 

Pista 3: р, = 11/18 
¿Cuál es la probabilidad de que 6 aviones que llegan al azar se distribuyan de la siguien- 
te manera? 

Pista 1: 2 aviones 

Pista 2: 1 avión 

Pista 3: 3 aviones 


Solución: Si usamos la distribución multinomial, tenemos 


2 11l 6 AA 
2,.1,35=,=.==,6) = = 2 Sia 
s( 9'6' 18 ) "A (5) (7) (з) 


Ejercicios 


5.1 Una variable aleatoria X que toma los valores x,, 
X,» X, se denomina variable aleatoria discreta uni- 
forme si su función de masa de probabilidad es f(x) = 
1 para todas las variables x,, x,,..., X, y O en cualquier 
Otro caso. Calcule la media y la varianza de X. 


5.2 Se entregan dos altavoces idénticos а 12 personas 
y se les pide que los escuchen para determinar si hay al- 
guna diferencia entre ellos. Suponga que sus respuestas 
son simplemente conjeturas. Calcule la probabilidad de 
que tres personas afirmen haber detectado una diferen- 
cia entre los dos altavoces. 


5.3 De un equipo de 10 empleados, y mediante la se- 
lección al azar de una etiqueta contenida en una caja 
que contiene 10 etiquetas numeradas del 1 al 10, se eli- 
ge a uno para que supervise cierto proyecto. Calcule la 
fórmula para la distribución de probabilidad de X que 
represente el número en la etiqueta que se saca. ¿Cuál 
es la probabilidad de que el número que se extrae 
sea menor que 4? 


5.4 En cierto distrito de la ciudad se establece que 
la causa de 75% de todos los robos es la necesidad 
de dinero para comprar drogas. Calcule la probabili- 
dad de que entre los siguientes cinco casos de robo que 
se reporten en este distrito, 
a) exactamente 2 sean resultado de la necesidad de 
dinero para comprar drogas; 
b) alo sumo 3 resulten de la necesidad de dinero para 
comprar drogas. 


6 2 1 IP 
= отпа Жош M 


Jl 


5.5 De acuerdo con Chemical Engineering Progress 
(noviembre de 1990), aproximadamente 30% de todas 
las fallas de operación en las tuberías de plantas quími- 
cas son ocasionadas por errores del operador. 

a) ¿Cuál es la probabilidad de que de las siguientes 
20 fallas en las tuberías al menos 10 se deban a un 
error del operador? 

b) ¿Cuál es la probabilidad de que no más de 4 de 20 
fallas se deban a un error del operador? 

c) Suponga que, para una planta específica, de la 
muestra aleatoria de 20 de tales fallas exactamente 
5 son errores de operación. ¿Considera que la cifra 
de 30% anterior se aplique a esta planta? Comente 
su respuesta. 


5.6 De acuerdo con una encuesta de la Administrative 
Management Society, la mitad de las empresas estado- 
unidenses da a sus empleados 4 semanas de vacaciones 
después de 15 años de servicio en la empresa. Calcule 
la probabilidad de que, de 6 empresas encuestadas al 
azar, el número que da a sus empleados 4 semanas de 
vacaciones después de 15 años de servicio es 
a) cualquiera entre 2 y 5; 
b) menor que 3. 
5.7 Un destacado médico afirma que el 70% de las 
personas con cáncer de pulmón son fumadores empe- 
dernidos. Si su aseveración es correcta, 
a) calcule la probabilidad de que de 10 de estos pa- 
cientes, que ingresaron recientemente a un hospital, 
menos de la mitad sean fumadores empedernidos; 


Ejercicios 


b) calcule la probabilidad de que de 20 de estos pa- 
cientes, que ingresaron recientemente a un hospital, 
menos de la mitad sean fumadores empedernidos. 


5.8 De acuerdo con un estudio publicado por un grupo 
de sociólogos de la Universidad de Massachusetts, 
aproximadamente 60% de los consumidores de Valium 
en el estado de Massachusetts empezaron a consumirlo 
a causa de problemas psicológicos. Calcule la probabi- 
lidad de que entre los siguientes 8 consumidores entre- 
vistados de este estado, 
a) exactamente 3 comenzaron a consumir Valium por 
problemas psicológicos; 
b) al menos 5 comenzaron a consumir Valium por 
problemas que no fueron psicológicos. 


5.9 Al probar cierta clase de neumático para camión 
en un terreno accidentado, se encuentra que el 25% de 
los camiones no completan la prueba de recorrido sin 
ponchaduras. De los siguientes 15 camiones probados, 
calcule la probabilidad de que 

a) de 3 a 6 tengan ponchaduras; 

b) menos de 4 tengan ponchaduras; 

c) más de 5 tengan ponchaduras. 


5.10 Según un informe de la revista Parade, una en- 
cuesta a nivel nacional, realizada por la Universidad de 
Michigan con estudiantes universitarios de último año, 
reveló que casi 70% desaprueban el consumo diario de 
marihuana. Si se seleccionan 12 estudiantes de último 
año al azar y se les pide su opinión, calcule la probabi- 
lidad de que el número de los que desaprueban el con- 
sumo diario de marihuana sea 

a) cualquiera entre 7 y 9; 

b) 5 alo sumo; 

с) no menos de 8. 


5.11 La probabilidad de que un paciente se recupere 
de una delicada operación de corazón es 0.9. ¿Cuál es 
la probabilidad de que exactamente 5 de los siguientes 
7 pacientes intervenidos sobrevivan? 


5.12 Un ingeniero de control de tráfico reporta que 
75% de los vehículos que pasan por un punto de verifica- 
ción son de ese estado. ¿Cuál es la probabilidad de que 
menos de 4 de los siguientes 9 vehículos sean de otro 
estado? 


5.13 Un estudio a nivel nacional que examinó las 
actitudes hacia los antidepresivos reveló que aproxi- 
madamente 70% de los encuestados cree que “105 an- 
tidepresivos en realidad no curan nada, sólo disfrazan 
el problema real”. De acuerdo con este estudio, ¿cuál 
es la probabilidad de que al menos 3 de las siguientes 
5 personas seleccionadas al azar tengan esta opinión? 


5.14 El porcentaje de victorias que consiguió el equi- 
po de baloncesto los Toros de Chicago para pasar a las 
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finales en la temporada 1996-97 fue de 87.7. Redondee 
87.7 a 90 para poder utilizar la tabla А.1. 

a) ¿Cuál es la probabilidad de que los Toros logren 
una victoria aplastante (4-0) en la serie final de 7 
juegos? 

b) ¿Cuál es la probabilidad de que los Toros ganen la 
serie inicial? 

с) ¿Qué suposición importante se hace al responder 
los incisos a) y b)? 


5.15 Se sabe que 60% de los ratones inoculados con 
un suero quedan protegidos contra cierta enfermedad. 
Si se inoculan 5 ratones, calcule la probabilidad de que 

a) ninguno contraiga la enfermedad; 

b) menos de 2 contraigan la enfermedad; 

c) más de 3 contraigan la enfermedad. 


5.16 Suponga que los motores de un avión operan de 
forma independiente y que tienen una probabilidad 
de falla de 0.4. Se supone que un avión tiene un vuelo 
seguro si funcionan al menos la mitad de sus motores. 
Si un avión tiene 4 motores y otro tiene 2, ¿cuál de los 
dos tiene la probabilidad más alta de un vuelo exitoso? 


5.17 Si X representa el número de personas del ejerci- 
cio 5.13 que creen que los antidepresivos no curan sino 
que sólo disfrazan el problema real, calcule la media y 
la varianza de X si se seleccionan al azar 5 personas. 


5.18 а) ¿Cuántos de los 15 camiones del ejercicio 5.9 
esperaría que tuvieran ponchaduras? 
b) ¿Cuál es la varianza del número de ponchaduras 
de los 15 camiones? ¿Qué significado tiene eso? 


5.19 Un estudiante que conduce hacia su escuela en- 
cuentra un semáforo, el cual permanece verde por 35 
segundos, amarillo cinco segundos y rojo 60 segundos. 
Suponga que toda la semana el estudiante recorre el 
camino a la escuela entre las 8:00 y las 8:30 a.m. Sea X, 
el número de veces que encuentra una luz verde, X, el 
número de veces que encuentra una luz amarilla y X, 
el número de veces que encuentra una luz roja. Calcule 
la distribución conjunta de Х,, X, y X, 


5.20 Según el diario USA Today (18 de marzo de 
1997), de 4 millones de integrantes de la fuerza laboral, 
5.8% resultó positivo en una prueba de drogas. De los 
que dieron positivo, 22.5% consumían cocaína y 54.4% 
consumían marihuana. 

a) ¿Cuál es la probabilidad de que de 10 trabajadores 
que dieron positivo, 2 sean usuarios de cocaína, 5 
de marihuana y 3 de otras drogas? 

b) ¿Cuál es la probabilidad de que de 10 trabajadores 
que dieron positivo, todos sean consumidores de 
marihuana? 

c) ¿Cuál es la probabilidad de que de 10 trabajadores 
que dieron positivo, ninguno consuma cocaína? 
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5.21 La superficie de un tablero circular para dardos 
tiene un pequeño círculo central llamado diana y 20 
regiones en forma de rebanada de pastel numeradas 
del 1 al 20. Asimismo, cada una de estas regiones está 
dividida en tres partes, de manera que una persona 
que lanza un dardo que cae en un número específico 
obtiene una puntuación igual al valor del número, el 
doble del número o el triple de éste, dependiendo de 
en cuál de las tres partes caiga el dardo. Si una per- 
sona tiene una probabilidad de 0.01 de acertar a la 
diana, una probabilidad de 0.10 de acertar un doble, 
una probabilidad de 0.05 de acertar un triple y una 
probabilidad de 0.02 de no acertar al tablero, ¿cuál 
es la probabilidad de que 7 lanzamientos den como 
resultado ninguna diana, ningún triple, dos dobles y 
una vez fuera del tablero? 


5.22 De acuerdo con la teoría genética, cierta cruza 
de conejillos de Indias tendrá crías rojas, negras y blan- 
cas en la proporción 8:4:4. Calcule la probabilidad de 
que de 8 crías, 5 sean rojas, 2 negras y 1 blanca. 


5.23 Las probabilidades de que un delegado llegue a 
cierta convención en avión, autobús, automóvil o tren 
son de 0.4, 0.2, 0.3 y 0.1, respectivamente. ¿Cuál es la 
probabilidad de que, de 9 delegados que asisten a esta 
convención seleccionados al azar, 3 lleguen en avión, 3 
en autobús, 1 en automóvil y 2 en tren? 


5.24 Un ingeniero de seguridad afirma que sólo 40% 
de los trabajadores utilizan cascos de seguridad cuando 
comen en el lugar de trabajo. Suponga que esta afirma- 
ción es cierta y calcule la probabilidad de que 4 de 6 
trabajadores elegidos al azar utilicen sus cascos mien- 
tras comen en el lugar de trabajo. 


5.3 Distribución hipergeométrica 
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5.25 Suponga que para un embarque muy grande de 
circuitos integrados, la probabilidad de que falle cual- 
quiera de ellos es de 0.10. Suponga que se cumplen los 
supuestos en que se basan las distribuciones binomiales 
y calcule la probabilidad de que en una muestra aleato- 
ria de 20 fallen, a lo sumo, 3 chips integrados. 


5.26 Suponga que 6 de 10 accidentes automovilísti- 
cos se deben principalmente a que no se respeta el lí- 
mite de velocidad y calcule la probabilidad de que, de 8 
accidentes automovilísticos, 6 se deban principalmente 
a una violación del límite de velocidad 
a) mediante el uso de la fórmula para la distribución 
binomial; 
b) usando la tabla А.1. 
5.27 Si una bombilla fluorescente tiene una probabi- 
lidad de 0.9 de tener una vida útil de al menos 800 ho- 
ras, calcule las probabilidades de que, de 20 bombillas 
fluorescentes, 
a) exactamente 18 tengan una vida útil de al menos 
800 horas; 
b) al menos 15 tengan una vida útil de al menos 800 
horas; 
с) al menos 2 no tengan una vida útil de al menos 800 
horas. 


5.28 Un fabricante sabe que, en promedio, 20% de los 
tostadores eléctricos producidos requerirá reparaciones 
durante el primer año posterior a su venta. Suponga que 
se seleccionan al azar 20 tostadores y calcule los núme- 
ros x y y adecuados tales que 
a) la probabilidad de que al menos x de ellos requie- 
ran reparaciones sea menor que 0.5; 
b) la probabilidad de que al menos y de ellos no re- 
quieran reparaciones sea mayor que 0.8. 


La manera más simple de ver la diferencia entre la distribución binomial de la sección 
5.2 y la distribución hipergeométrica consiste en observar la forma en que se realiza el 
muestreo. Los tipos de aplicaciones de la distribución hipergeométrica son muy simi- 
lares a los de la distribución binomial. Nos interesa el cálculo de probabilidades para el 
número de observaciones que caen en una categoría específica. Sin embargo, la distri- 
bución binomial requiere que los ensayos sean independientes. Por consiguiente, si se 
aplica esta distribución, digamos, tomando muestras de un lote de artículos (barajas, lotes 
de artículos producidos), el muestreo se debe efectuar reemplazando cada artículo des- 
pués de observarlo. Por otro lado, la distribución hipergeométrica no requiere indepen- 
dencia y se basa en el muestreo que se realiza sin reemplazo. 

Las aplicaciones de la distribución hipergeométrica se encuentran en muchos cam- 
pos, sobre todo en el muestreo de aceptación, las pruebas electrónicas y los controles 
de calidad. Evidentemente, en muchos de estos campos el muestreo se realiza a expen- 
sas del artículo que se prueba; es decir, el artículo se destruye, por lo que no se puede 
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Distribución 


reemplazar en la muestra. Por consiguiente, el muestreo sin reemplazo es necesario. 
Utilizaremos un caso simple con barajas para nuestro primer ejemplo. 

Si deseamos calcular la probabilidad de obtener 3 cartas rojas en 5 extracciones de 
una baraja ordinaria de 52 cartas, la distribución binomial de la sección 5.2 no se aplica a 
menos que cada carta se reemplace y que el paquete se revuelva antes de extraer la si- 
guiente carta. Para resolver el problema del muestreo sin reemplazo volvamos a plantear 
el problema. Si se sacan 5 cartas al azar, nos interesa la probabilidad de seleccionar 3 
cartas rojas de las 26 disponibles y 2 de las 26 cartas negras de que dispone la baraja. Hay 
Е ) formas de seleccionar 3 cartas rojas, у para cada una de estas formas podemos elegir 
2 cartas negras de (=) maneras. Por lo tanto, el número total de formas de seleccionar 3 
cartas rojas y 2 negras en 5 extracciones es el producto le ) ). El número total de formas 
de seleccionar cualesquiera 5 cartas de las 52 disponibles es (2). En consecuencia, la 
probabilidad de seleccionar 5 cartas sin reemplazo, de las cuales 3 sean rojas y 2 negras 
está dada por 


(2) G) _ 061/31231)(261/2124)) 


(2) 521/5147! 


= 0.3251. 


En general, nos interesa la probabilidad de seleccionar x éxitos de los k artículos con- 
siderados éxitos y n — x fracasos de los N — k artículos que se consideran fracasos cuando 
una muestra aleatoria de tamaño n se selecciona de N artículos. Esto se conoce como un 
experimento hipergeométrico; es decir, aquel que posee las siguientes dos propieda- 
des: 


1. De un lote de N artículos se selecciona una muestra aleatoria de tamaño n sin re- 
emplazo. 

2. К de los N artículos se pueden clasificar como éxitos y N — k se clasifican como 
fracasos. 


El número X de éxitos de un experimento hipergeométrico se denomina variable 
aleatoria hipergeométrica. En consecuencia, la distribución de probabilidad de la va- 
riable hipergeométrica se conoce como distribución hipergeométrica, y sus valores se 
denotan con h(x; N, n, k), ya que dependen del número de éxitos k en el conjunto N del 
que seleccionamos п artículos. 


hipergeométrica en el muestreo de aceptación 


Como en el caso de la distribución binomial, la distribución hipergeométrica se aplica en 
el muestreo de aceptación, donde se toman muestras del material o las partes de los lotes 
con el fin de determinar si se acepta o no el lote completo. 


Ejemplo 5.8: | Una parte específica que se utiliza como dispositivo de inyección se vende en lotes de 10. 


Solución: 


El productor considera que el lote es aceptable si no tiene más de un artículo defectuoso. 
Un plan de muestreo incluye un muestreo aleatorio y la prueba de 3 de cada 10 partes. 
Si ninguna de las 3 está defectuosa, se acepta el lote. Comente acerca de la utilidad de 
este plan. 

Supongamos que el lote es verdaderamente inaceptable (es decir, que 2 de cada 10 par- 
tes están defectuosas). La probabilidad de que el plan de muestreo considere que el lote 


aceptable es 
(0) 6) 


(5) 


Р(Х =0) = = 0.467. 


154 Capítulo 5 Algunas distribuciones de probabilidad discreta 


Por consiguiente, si el lote es realmente inaceptable porque 2 partes están defectuosas, 
este plan de muestreo permitirá que se acepte aproximadamente 47% de las veces. Como 
resultado, este plan debería considerarse inadecuado. J 

Hagamos una generalización para calcular una fórmula para h(x; N, n, k). El número 
total de muestras de tamaño n elegidas de N artículos es (~ ). Se supone que estas mues- 
tras tienen la misma probabilidad. Hay de ) formas de seleccionar х éxitos de los k dispo- 
nibles, y por cada una de estas formas podemos elegir n — x fracasos en formas ("= Еч); 
De esta manera, el número total de muestras favorables entre las del ) muestras posibles, 
está dado por ( И) ои ы, En consecuencia, tenemos la siguiente definición. 


Distribución La distribución de probabilidad de la variable aleatoria hipergeométrica X, el número 
hipergeométrica de éxitos en una muestra aleatoria de tamaño n que se selecciona de N artículos, en los 
que k se denomina éxito y N – k fracaso, es 


ky (N к 
СЙ) 
N > 
(a) 
El rango de x puede determinarse mediante los tres coeficientes binomiales en la de- 
finición, donde x y n — x no son más que К y № ~ k; respectivamente; y ambos no pueden 
ser menores que 0. Por lo general, cuando tanto k (el número de éxitos) como N — k (el 


número de fracasos) son mayores que el tamaño de la muestra n, el rango de una variable 
aleatoria hipergeométrica será x = 0, 1,..., n 


h(x; N, n, k) = máx (0,n — (N — k)} <x < mín{n, k}. 


Ejemplo 5.9: | Lotes con 40 componentes cada uno que contengan 3 o más defectuosos se consideran 
inaceptables. El procedimiento para obtener muestras del lote consiste en seleccionar 5 
componentes al azar y rechazar el lote si se encuentra un componente defectuoso. ¿Cuál 
es la probabilidad de, que en la muestra, se encuentre exactamente un componente de- 
fectuoso, si en todo el lote hay 3 defectuosos? 

Solución: Si utilizamos la distribución hipergeométrica con n = 5, N = 40, k = 3 y x = 1, encon- 
tramos que la probabilidad de obtener un componente defectuoso es 


3y (37 
h(1;40, 5,3) = QG) = 0.3011. 


40 

(5) 
De nueva cuenta este plan no es adecuado porque sólo 30% de las veces detecta un lote 
malo (con 3 componentes defectuosos). JJ 


Teorema 5.2: La media y la varianza de la distribución hipergeométrica h(x; N, n, k) son 


nk E N -n k 1 К 
z= — == “е —— — — |. 
= соу N- N N 


La demostración para la media se muestra en el apéndice A.24. 


Ejemplo 5.10: | Volvamos a investigar el ejemplo 3.4 de la página 83. La finalidad de este ejemplo fue 
ilustrar el concepto de una variable aleatoria y el espacio muestral correspondiente. En 
el ejemplo tenemos un lote de 100 artículos, de los cuales 12 están defectuosos. ¿Cuál es 
la probabilidad de que haya 3 defectuosos en una muestra de 10? 
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Solución: Si utilizamos la función de probabilidad hipergeométrica, tenemos 


ŒE) 
h(3; 100, 10, 12) = 22 = 0.08. 

( 10 ) J 
Ejemplo 5.11: | Calcule la media y la varianza de la variable aleatoria del ejemplo 5.9, y después utilice 

el teorema de Chebyshev para interpretar el intervalo и + 20. 
Solución: Como el ejemplo 5.9 fue un experimento hipergeométrico con N = 40, n = 5y k = 3, 

usando el teorema 5.2, tenemos 
_66) _3 


a =2=0375 
= 10 = 


2_ (4-5 2 -2 2\ 
с = z ) в) (5) ( б] 0313 


Si calculamos la raíz cuadrada de 0.3113, encontramos que с = 0.558. Por lo tanto, 
el intervalo que se requiere es 0.375 + (2)(0.558), o de –0.741 а 1.491. El teorema 
de Chebyshev establece que el número de componentes defectuosos que se obtienen 
cuando, de un lote de 40 componentes, se seleccionan 5 al azar, de los cuales 3 están 
defectuosos, tiene una probabilidad de al menos 3/4 de caer entre —0.741 y 1.491. Esto 
es, al menos tres cuartas partes de las veces los 5 componentes incluirán menos de 2 
defectuosos. 


Relación con la distribución binomial 


En este capítulo examinamos varias distribuciones discretas importantes que tienen 
diversas aplicaciones. Muchas de estas distribuciones se relacionan bien entre sí. El 
estudiante novato debería tener una clara comprensión de tales relaciones. Existe una 
relación interesante entre las distribuciones hipergeométrica y binomial. Como se es- 
peraría, si n es pequeña comparada con N, la naturaleza de los N artículos cambia muy 
poco en cada prueba. Así, cuando n es pequeña en comparación con N, se puede utilizar 
una distribución binomial para aproximar la distribución hipergeométrica. De hecho, por 
regla general la aproximación es buena cuando n/N < 0.05. 

Por lo tanto, la cantidad k/N desempeña el papel del parámetro binomial p y, como 
consecuencia, la distribución binomial se podría considerar una versión de población 
grande de la distribución hipergeométrica. La media y la varianza entonces se obtienen 
de las fórmulas 


Al comparar estas fórmulas con las del teorema 5.2, vemos que la media es la misma, 
mientras que la varianza difiere por un factor de corrección de (N – n)/(N – 1), que es 
insignificante cuando n es pequeña en relación con N. 


Ejemplo 5.12: | Un fabricante de neumáticos para automóvil reporta que de un cargamento de 5000 pie- 
zas que se mandan a un distribuidor local, 1000 están ligeramente manchadas. Si se 
compran al azar 10 de estos neumáticos al distribuidor, ¿cuál es la probabilidad de que 
exactamente 3 estén manchados? 
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Solución: 
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Como N = 5000 es grande con respecto a la muestra de tamaño n = 10, nos aproxima- 
remos a la probabilidad deseada usando la distribución binomial. La probabilidad de 
obtener un neumático manchado es 0.2. Por lo tanto, la probabilidad de obtener exacta- 
mente 3 manchados es 


h(3; 5000, 10, 1000) = А3; 10, 0.2) = 0.8791 — 0.6778 = 0.2013. 


Por otro lado, la probabilidad exacta es h(3; 5000, 10, 1000) = 0.2015. J 
La distribución hipergeométrica se puede extender para tratar el caso donde los N 
artículos se pueden dividir еп k celdas A, A,,..., A, con a, elementos en la primera celda, 
a, en la segunda,..., a, elementos en la уша celda. Lo que nos interesa ahora es la 
probabilidad de que una muestra aleatoria de tamaño л produzca x, elementos de A, 
elementos de A,, ..., у x, elementos de A,. Representemos esta probabilidad пол 


F(%1,X2,...,Xx34],02,..., ар, №п). 


Para obtener una fórmula general observamos que el número total de muestras de 
tamaño n que se pueden elegir a partir de N artículos es aún E ). Hay (е ) formas 
de seleccionar x, artículos de los que hay en A,, y para cada uno de éstos podemos elegir 
x, de los de A, en ($ 2) formas. Por lo tanto, podemos seleccionar x, artículos de A, y x, 
artículos de A, en 5) (0) formas. Si continuamos de esta forma, podemos selec- 


cionar todos los n artículos que constan de x, de A, x, de A,,..., y x, de A, en 


CE) E) temas 


La distribución de probabilidad que se requiere se define ahora como sigue. 


Distribución 
hipergeométrica 
multivariada 


Si N artículos se pueden dividir en las k celdas A, Аг. А, соп а, а,,..., а, elementos, 
respectivamente, entonces la distribución de probabilidad de las variables aleatorias Х,, 
Х,,..., X,, que representan el número de elementos que se seleccionan de A, Arne A, en 
una muestra aleatoria de tamaño n, es 


Í(1,X2,...,X341,02,...,04,N,n) = 


k k 
con dix = пу Уа = № 


і=1 i=1 


Ejemplo 5.13: | Se usa un grupo de 10 individuos para un estudio de caso biológico. El grupo contiene 3 


Solución: 


personas con sangre tipo O, 4 con sangre tipo A y 3 con tipo B. ¿Cuál es la probabilidad 
de que una muestra aleatoria de 5 contenga 1 persona con sangre tipo O, 2 personas con 
tipo A y 2 personas con tipo B? 

Si se utiliza la extensión de la distribución hipergeométrica con х, = 1, x, = 2, x, = 2, 
a, =3,a,=4,a,=3,N=10 y n= 5, vemos que la probabilidad que se “desea es 


ОТО 3 
f(,2,2;3,4,3, 10,5) = е 


Ejercicios 


Ejercicios 


5.29 El dueño de una casa planta 6 bulbos selecciona- 
dos al azar de una caja que contiene 5 bulbos de tulipán 
y 4 de narciso. ¿Cuál es la probabilidad de que plante 2 
bulbos de narciso y 4 de tulipán? 


5.30 Para evitar la detección en la aduana, un viajero 
coloca 6 comprimidos con narcóticos en una botella 
que contiene 9 píldoras de vitamina que aparentemente 
son similares. Si el oficial de la aduana selecciona 3 de 
las tabletas al azar para su análisis, ¿cuál es la probabi- 
lidad de que el viajero sea arrestado por posesión ilegal 
de narcóticos? 


5.31 Se selecciona al azar un comité de 3 perso- 
nas a partir de 4 médicos y 2 enfermeras. Escriba una 
fórmula para la distribución de probabilidad de la va- 
riable aleatoria X que representa el número de médicos 
en el comité. Calcule PQ < X < 3). 


5.32 De un lote de 10 misiles, se seleccionan 4 al azar 
y se disparan. Si el lote contiene 3 misiles defectuosos 
que no pueden dispararse, ¿cuál es la probabilidad de que 
a) los 4 puedan dispararse? 
b) alo sumo fallen 2? 


5.33 51 de una baraja ordinaria de 52 cartas, se toman 
7 y se reparten, ¿cuál es la probabilidad de que 

a) exactamente 2 de ellas sean cartas de figuras? 

b) al menos 1 de ellas sea una reina? 


5.34 ¿Cuál es la probabilidad de que una camarera se 
rehúse a servir bebidas alcohólicas a sólo 2 menores si 
verifica al azar 5 identificaciones de 9 estudiantes, de 
los cuales 4 son menores de edad? 


5.35 Una empresa está interesada en evaluar su pro- 
cedimiento de inspección actual para embarques de 50 
artículos idénticos. El procedimiento consiste en tomar 
una muestra de 5 artículos y aceptar el embarque si no 
se encuentran más de 2 defectuosos. ¿Qué proporción 
de embarques con 20% de artículos defectuosos se 
aceptará? 


5.36 Una empresa de manufactura utiliza un esquema 
de aceptación para los artículos de una línea de produc- 
ción antes de que se embarquen. El plan tiene dos eta- 
pas. Se preparan cajas de 25 artículos para su embarque 
y se prueba una muestra de 3 en busca de defectuosos. 
Si se encuentra alguno defectuoso, se regresa toda la 
caja para verificar el 100% de ellos. Si no se encuentran 
artículos defectuosos, la caja se embarca. 
a) ¿Cuál es la probabilidad de que se embarque una 
caja que contiene 3 defectuosos? 
b) ¿Cuál es la probabilidad de que se regrese para su 
revisión una caja que contenga sólo un artículo de- 
fectuoso? 
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5.37 Suponga que la empresa fabricante del ejercicio 
5.36 decide cambiar su esquema de aceptación. Con el 
nuevo esquema un inspector toma un artículo al azar, lo 
inspecciona y después lo regresa а la caja; un segundo 
inspector hace lo mismo. Finalmente, un tercer inspec- 
tor lleva a cabo el mismo procedimiento. Si cualquiera 
de los tres encuentra un artículo defectuoso, la caja no 
se embarca. Responda los incisos del ejercicio 5.36 con 
este nuevo plan. 


5.38 De los 150 empleados de hacienda en una ciu- 
dad grande, sólo 30 son mujeres. Suponga que se eli- 
gen al azar 10 de los empleados para que proporcionen 
asesoría gratuita sobre declaraciones de impuestos a los 
residentes de esta ciudad; utilice la aproximación bino- 
mial a la distribución hipergeométrica para calcular la 
probabilidad de que se seleccionen al menos 3 mujeres. 


5.39 Una ciudad vecina considera entablar una de- 
manda de anexión en contra de una subdivisión del 
condado de 1200 residencias. Si los ocupantes de la 
mitad de las residencias objetan la anexión, ¿cuál es 
la probabilidad de que en una muestra aleatoria de 10 
residencias al menos 3 estén a favor de la anexión? 


5.40 бе estima que 4000 de los 10,000 residentes con 
derecho al voto de una ciudad están en contra de un 
nuevo impuesto sobre las ventas. Si se seleccionan al 
azar 15 votantes y se les pide su opinión, ¿cuál es la 
probabilidad de que a lo sumo 7 estén a favor del nuevo 
impuesto? 


5.41 Una encuesta a nivel nacional, realizada por la 
Universidad de Michigan a 17,000 estudiantes univer- 
sitarios de último año, revela que casi 70% desaprueba 
el consumo diario de marihuana. Si se seleccionan al 
azar 18 de tales estudiantes y se les pide su opinión, 
¿cuál es la probabilidad de que más de 9 pero menos de 
14 desaprueben el consumo de marihuana? 


5.42 Calcule la probabilidad de que si le toca una 
mano de bridge de 13 cartas, ésta incluya 5 espadas, 2 
corazones, 3 diamantes y 3 tréboles. 


5.43 Un club de estudiantes extranjeros tiene como 

miembros a 2 canadienses, 3 japoneses, 5 italianos y 

2 alemanes. Si se selecciona al azar un comité de 4, 

calcule la probabilidad de que 

a) todas las nacionalidades estén representadas; 

b) todas las nacionalidades estén representadas, ex- 
cepto la italiana. 


5.44 Una urna contiene 3 bolas verdes, 2 azules y 4 
rojas. Calcule la probabilidad de que, en una muestra 
aleatoria de 5 bolas, se seleccionen las 2 bolas azules y 
al menos una roja. 
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5.45 A menudo los biólogos que estudian un ambiente 
específico etiquetan y liberan a sujetos con el fin de esti- 
mar el tamaño de la población o la prevalencia de ciertas 
características en ella. Los biólogos capturan a 10 anima- 
les de una especie que se piensa extinta (o casi extinta), 
los etiquetan y los liberan en cierta región. Después de 
un periodo seleccionan en la región una muestra aleato- 
па de 15 animales de ese tipo. ¿Cuál es la probabilidad 
de que 5 de los animales seleccionados estén etiqueta- 
dos, si hay 25 animales de este tipo en la región? 


5.46 Una empresa grande tiene un sistema de inspec- 
ción para los lotes de compresores pequeños que compra 
a los vendedores. Un lote típico contiene 15 compreso- 
res. En el sistema de inspección se selecciona una mues- 
tra aleatoria de 5 compresores para someterlos a prueba. 
Suponga que en el lote de 15 hay 2 defectuosos. 
a) ¿Cuál es la probabilidad de que en una muestra 
determinada haya un compresor defectuoso? 
b) ¿Cuál es la probabilidad de que la inspección des- 
cubra los 2 compresores defectuosos? 


5.47 Una fuerza de tareas gubernamental sospecha 
que algunas fábricas infringen los reglamentos fede- 
rales contra la contaminación ambiental en lo que se 
refiere a la descarga de cierto tipo de producto. Veinte 
empresas están bajo sospecha pero no todas se pueden 
inspeccionar. Suponga que 3 de las empresas infringen 
los reglamentos. 
a) ¿Cuál es la probabilidad de que si se inspeccionan 
5 empresas no se encuentre ninguna infracción? 
b) ¿Cuál es la probabilidad de que la inspección de 
5 empresas descubra a 2 que infringen el regla- 
mento? 


5.48 Una máquina llena 10,000 latas de bebida ga- 
seosa por hora, de entre las cuales 300 resultan con 
el líquido incompleto. Cada hora se elige al azar una 
muestra de 30 latas y se verifica el número de onzas 
de gaseosa que contiene cada una. Denote con X el nú- 
mero de latas seleccionadas con llenado insuficiente. 
Encuentre la probabilidad de encontrar al menos una de 
las latas muestreadas con llenado insuficiente. 


5.4 Distribuciones binomial negativa y geométrica 


Consideremos un experimento con las mismas propiedades de un experimento binomial, 
sólo que en este caso las pruebas se repetirán hasta que ocurra un número fijo de éxitos. 
Por lo tanto, en vez de encontrar la probabilidad de x éxitos en п pruebas, donde п es fija, 
ahora nos interesa la probabilidad de que ocurra el k-ésimo éxito en la x-ésima prueba. 
Los experimentos de este tipo se llaman experimentos binomiales negativos. 

Como ejemplo, considere el uso de un medicamento que se sabe que es eficaz en 
el 60% de los casos en que se utiliza. El uso del medicamento se considerará un éxito 51 
proporciona algún grado de alivio al paciente. Nos interesa calcular la probabilidad de 
que el quinto paciente que experimente alivio sea el séptimo paciente en recibir el medi- 
camento en una semana determinada. Si designamos un éxito con E y un fracaso con F, 
un orden posible para alcanzar el resultado que se desea es EFEEEFE, que ocurre con 
la siguiente probabilidad 


(0.6) (0.4) (0.6) (0.6) (0.6) (0.4) (0.6) = (0.6)* (0.4). 


Podríamos listar todos los posibles ordenamientos reacomodando las F y las E, con 
excepción del último resultado, que debe ser el quinto éxito. El número total de ordena- 
mientos posibles es igual al número de particiones de los primeros 6 ensayos en 2 grupos 
con dos fracasos asignados a un grupo y 4 éxitos asignados al otro grupo. Esto se puede 
realizar en (%) = 15 formas mutuamente excluyentes. Por lo tanto, si X representa el 
resultado en el que ocurre el quinto éxito, entonces 


Р(Х =7= (2) (0.6) (0.4)? = 0.1866. 


¿Cuál es la variable aleatoria binomial negativa? 


El número X de ensayos necesarios para generar k éxitos en un experimento binomial ne- 
gativo se denomina variable aleatoria binomial negativa y su distribución de probabi- 
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lidad se llama distribución binomial negativa. Dado que sus probabilidades dependen 
del número de éxitos deseados y de la probabilidad de un éxito en un ensayo dado, de- 
notaremos ambas probabilidades con el símbolo b*(x; k, p). Para obtener la fórmula ge- 
neral para b*(x; k, p), considere la probabilidad de un éxito en el x-ésimo ensayo 
precedido рог k— 1 éxitos y х – k fracasos en un orden específico. Como los ensayos son 
independientes podemos multiplicar todas las probabilidades que corresponden a cada 
resultado deseado. La probabilidad de que ocurra un éxito es p y la probabilidad de que 
ocurra un fracaso es q = 1 — p. Por lo tanto, la probabilidad para el orden específico, 
que termina en un éxito, es 
plg ~p = ре“. 
El número total de puntos muestrales en el experimento que termina en un éxito, des- 
pués de la ocurrencia de k – 1 éxitos y х – k fracasos en cualquier orden, es igual al nú- 
mero de particiones de х – 1 ensayos en dos grupos соп k — 1 éxitos, que corresponden 
a un grupo, y x— k fracasos, que corresponden al otro grupo. Este número se especifica 
con el término (К); cada uno es mutuamente excluyente y tiene las mismas probabi- 
Кох 


lidades de ocurrir p*g'-*, Obtenemos la fórmula general multiplicando p*g*"* por б Н; 


Distribución 
binomial 
negativa 


Si ensayos independientes repetidos pueden dar como resultado un éxito con probabili- 
dad p y un fracaso con probabilidad q = 1 — p, entonces la distribución de probabilidad 
de la variable aleatoria X, el número del ensayo en el que ocurre el k-ésimo éxito, es 


= 1 e 
Paek р) = e _ к: x=kk+1k+2... 


Ejemplo 5.14: | En la serie de campeonato de la NBA (National Basketball Association), el equipo que 


Solución: 


gane 4 de 7 juegos será el ganador. Suponga que los equipos A y B se enfrentan en los 
juegos de campeonato y que el equipo A tiene una probabilidad de 0.55 de ganarle al 
equipo B. 

a 
b 
c) Si ambos equipos se enfrentaran en la eliminatoria de una serie regional y el triunfa- 


dor fuera el que ganara 3 de 5 juegos, ¿cuál es la probabilidad de que el equipo A 
gane la serie? 


a) b*(6;4,0.55) = (5)0.554(1 — 0.55)6—# = 0.1853. 
b 


ми 


¿Cuál es la probabilidad de que el equipo А gane la serie en 6 juegos? 


ме 


¿Cuál es la probabilidad de que el equipo A gane la serie? 


ме 


P(el equipo А gana la serie de campeonato) es 


0*(4;4, 0.55) + 2*(5;4, 0.55) + b*(6;4,0.55) + b*(7; 4, 0.55) 
= 0.0915 + 0.1647 + 0.1853 + 0.1668 = 0.6083. 
c) P(el equipo A gana la eliminatoria) es 


b*(3;3, 0.55) + b*(4;3, 0.55) + b*(5;3, 0.55) 
= 0.1664 + 0.2246 + 0.2021 = 0.5931. A | 
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La distribución binomial negativa deriva su nombre del hecho de que cada tér- 
mino de la expansión de p*(1 — g)* corresponde a los valores de b*(x; k, p) para x = k, 
k + 1, k + 2,.... Si consideramos el caso especial de la distribución binomial negativa, 
donde k = 1, tenemos una distribución de probabilidad para el número de ensayos que 
se requieren para un solo éxito. Un ejemplo sería lanzar una moneda hasta que salga 
una cara. Nos podemos interesar en la probabilidad de que la primera cara resulte en el 
cuarto lanzamiento. En este caso la distribución binomial negativa se reduce a la forma 


(xiL,p)=pg""? x=1,2,3,... 


Como los términos sucesivos constituyen una progresión geométrica, se acostumbra re- 
ferirse a este caso especial como distribución geométrica y denotar sus valores con 


gx; p). 


Distribución 
geométrica 


Si pruebas independientes repetidas pueden tener como resultado un éxito con probabi- 
lidad p y un fracaso con probabilidad q = 1 ~ p, entonces la distribución de probabilidad 
de la variable aleatoria X, el número de la prueba en el que ocurre el primer éxito, es 


g(x; p) = pq™7!, x= 1,2,3,... 


Ejemplo 5.15: | Se sabe que en cierto proceso de fabricación uno de cada 100 artículos, en promedio, 


Solución: 


resulta defectuoso. ¿Cuál es la probabilidad de que el quinto artículo que se inspecciona, 
en un grupo de 100, sea el primer defectuoso que se encuentra? 
Si utilizamos la distribución geométrica con x = 5 y p = 0.01, tenemos 


8(5;0.01) = (0.01)(0.99)* = 0.0096. И | 


Ejemplo 5.16: | En “momentos ajetreados” un conmutador telefónico está muy cerca de su límite de 


Solución: 


Teorema 5.3: 


capacidad, por lo que los usuarios tienen dificultad para hacer sus llamadas. Sería inte- 
resante saber cuántos intentos serían necesarios para conseguir un enlace telefónico. 
Suponga que la probabilidad de conseguir un enlace durante un momento ajetreado es 
p = 0.05. Nos interesa conocer la probabilidad de que se necesiten 5 intentos para enla- 
zar con éxito una llamada. 

Si utilizamos la distribución geométrica con x = 5 y p = 0.05, obtenemos 


Р(Х = x) = g(5;0.05) = (0.05)10.95)* = 0.041. J 


Muy a menudo, en aplicaciones que tienen que ver con la distribución geométrica, 
la media y la varianza son importantes. Se puede ver esto en el ejemplo 5.16, en donde 
el número esperado de llamadas necesario para lograr un enlace es muy importante. A 
continuación se establecen, sin demostración, la media y la varianza de la distribución 
geométrica. 


La media y la varianza de una variable aleatoria que sigue la distribución geométrica 
son 
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Aplicaciones de las distribuciones binomial negativa y geométrica 


Las áreas de aplicación de las distribuciones binomial negativa y geométrica serán evi- 
dentes cuando nos enfoquemos en los ejemplos de esta sección y en los ejercicios que 
se dedican a tales distribuciones al final de la sección 5.5. En el caso de la distribución 
geométrica, el ejemplo 5.16 describe una situación en que los ingenieros о adminis- 
tradores intentan determinar cuán ineficiente es un sistema de conmutación telefónica 
durante periodos ajetreados. En este caso es evidente que los ensayos que ocurren antes 
de un éxito representan un costo. Si hay una alta probabilidad de que se requieran varios 
intentos antes de lograr conectarse, entonces se debería rediseñar el sistema. 

Las aplicaciones de la distribución binomial negativa son similares por naturaleza. 
Supongamos que los intentos son costosos en algún sentido y que ocurren en secuencia. 
La alta probabilidad de que se requiera un número “grande” de intentos para experi- 
mentar un número fijo de éxitos no es benéfica ni para el científico ni para el ingeniero. 
Considere los escenarios de los ejercicios de repaso 5.90 y 5.91. En el ejercicio 5.91 el 
perforador define cierto nivel de éxitos perforando diferentes sitios en secuencia para 
encontrar petróleo. Si sólo se han hecho 6 intentos en el momento en que se experimenta 
el segundo éxito, parecería que las utilidades superan de forma considerable la inversión 
en que se incurre para la perforación. 


5.5 Distribución de Poisson y proceso de Poisson 


Los experimentos que producen valores numéricos de una variable aleatoria X, el nú- 
mero de resultados que ocurren durante un intervalo de tiempo determinado o en una 
región específica, se denominan experimentos de Poisson. El intervalo de tiempo puede 
ser de cualquier duración, como un minuto, un día, una semana, un mes o incluso un año. 
Por ejemplo, un experimento de Poisson podría generar observaciones para la variable 
aleatoria X que representa el número de llamadas telefónicas por hora que recibe una 
oficina, el número de días que una escuela permanece cerrada debido a la nieve durante 
el invierno o el número de juegos suspendidos debido a la lluvia durante la temporada 
de béisbol. La región específica podría ser un segmento de recta, una área, un volumen 
O quizá una pieza de material. En tales casos X podría representar el número de ratas de 
campo por acre, el número de bacterias en un cultivo dado o el número de errores meca- 
nográficos por página. Un experimento de Poisson se deriva del proceso de Poisson y 
tiene las siguientes propiedades: 


Propiedades del proceso de Poisson 


1. El número de resultados que ocurren en un intervalo o región específica es indepen- 
diente del número que ocurre en cualquier otro intervalo de tiempo o región del 
espacio disjunto. De esta forma vemos que el proceso de Poisson no tiene memoria. 


2. La probabilidad de que ocurra un solo resultado durante un intervalo de tiempo 
muy corto o en una región pequeña es proporcional a la longitud del intervalo o al 
tamaño de la región, y no depende del número de resultados que ocurren fuera de 
este intervalo de tiempo o región. 


3. La probabilidad de que ocurra más de un resultado en tal intervalo de tiempo corto 
о que caiga en tal región pequeña es insignificante. 


El número X de resultados que ocurren durante un experimento de Poisson se llama 
variable aleatoria de Poisson y su distribución de probabilidad se llama distribu- 
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ción de Poisson. El número medio de resultados se calcula a partir de u = At, donde t 
es el “tiempo”, la “distancia”, el “área” o el “volumen” específicos de interés. Como las 
probabilidades dependen de A, denotaremos la tasa de ocurrencia de los resultados con 
р(х; №). La derivación de la fórmula para р(х; №), que se basa en las tres propiedades 
de un proceso de Poisson que se listaron antes, está fuera del alcance de este texto. La 
siguiente fórmula se utiliza para calcular probabilidades de Poisson. 


Distribución 
de Poisson 


La distribución de probabilidad de la variable aleatoria de Poisson X, la cual representa 
el número de resultados que ocurren en un intervalo de tiempo dado o región específicos 
y se denota con т, es 


р(х; At) = 


—^ї [)* 
_ PT а 


donde A es el número promedio de resultados por unidad de tiempo, distancia, área o 
volumen y e = 2.71828... 


La tabla A.2 contiene las sumatorias de la probabilidad de Poisson 
P(r; àt) = X р(х; А), 
x=0 


para valores selectos de Af que van de 0.1 a 18.0 Ilustramos el uso de esta tabla con los 
siguientes dos ejemplos. 


Ejemplo 5.17: | Durante un experimento de laboratorio el número promedio de partículas radiactivas que 


Solución: 


pasan a través de un contador en un milisegundo es 4. ¿Cuál es la probabilidad de 
que entren 6 partículas al contador en un milisegundo dado? 

Al usar la distribución de Poisson con x = 6 y Af = 4, y al remitirnos a la tabla A.2, te- 
nemos que 


-446 6 5 
р6:4) = E =} p(x:4) – У |р(х;4) = 0.8893 —0.7851 = 0.1042. 
` x=0 х=0 J 


Ejemplo 5.18: | El número promedio de camiones-tanque que llega cada día a cierta ciudad portuaria es 


Solución: 


Teorema 5.4: 


10. Las instalaciones en el puerto pueden alojar a lo sumo 15 camiones-tanque por día. 
¿Cuál es la probabilidad de que en un día determinado lleguen más de 15 camiones y se 
tenga que rechazar algunos? 

Sea X el número de camiones-tanque que llegan cada día. Entonces, usando la tabla A.2, 


tenemos 
15 


Р(Х > 15) = 1-Р(Х <15)=1-— ES 10) = 1 — 0.9513 = 0.0487. 
x=0 J 
Como la distribución binomial, la distribución de Poisson se utiliza para control de 
calidad, aseguramiento de calidad y muestreo de aceptación. Además, ciertas distribucio- 
nes continuas importantes que se usan en la teoría de confiabilidad y en la teoría de colas 
dependen del proceso de Poisson. Algunas de estas distribuciones se analizan y desarro- 
llan en el capítulo 6. El siguiente teorema acerca de la variable aleatoria de Poisson se 
presenta en el apéndice A.25. 


Tanto la media сото la varianza de la distribución de Poisson р(х; №) son At. 


5.5 Distribución de Poisson y proceso de Poisson 163 


Naturaleza de la función de probabilidad de Poisson 


0.75 


0.25 


Al igual que muchas distribuciones discretas y continuas, la forma de la distribución de 
Poisson se vuelve cada vez más simétrica, incluso con forma de campana, a medida 
que la media se hace más grande. Una ilustración de esto son las gráficas de la función 
de probabilidad para и = 0.1, и = 2 y finalmente и = 5 que se muestran en la figura 5.1. 
Observe cómo se acercan a la simetría cuando u se vuelve tan grande como 5. Con la 
distribución binomial ocurre algo parecido, como se ilustrará más adelante en este texto. 


0.30 0.30 
p=0.1 p=2 p=5 

0.20 0.20 

Ss Ss 

ч. ч 
0.10 0.10 

х 0 х 0 х 
4 6 8 10 0 2 4 6 8 10 0.2.4 6 8 10 


Figura 5.1: Funciones de densidad de Poisson para diferentes medias. 


Aproximación de una distribución binomial por medio 
de una distribución de Poisson 


Teorema 5.5: 


A partir de los tres principios del proceso de Poisson debería ser evidente que la distri- 
bución de Poisson se relaciona con la distribución binomial. Aunque la de Poisson por 
lo general se aplica en problemas de espacio y tiempo, como se ilustra con los ejemplos 
5.17 y 5.18, se podría considerar como una forma limitante de la distribución binomial. 
En el caso de la distribución binomial, si n es bastante grande y p es pequeña, las condi- 
ciones comienzan a simular las implicaciones de espacio o tiempo continuos del proceso 
de Poisson. La independencia entre las pruebas de Bernoulli en el caso binomial es con- 
sistente con la segunda propiedad del proceso de Poisson. Permitir que el parámetro p se 
acerque a cero se relaciona con la tercera propiedad del proceso de Poisson. De hecho, 
si n es grande y p es cercana a 0, se puede usar la distribución de Poisson, con u = np, 
para aproximar probabilidades binomiales. Si p es cercana a 1, aún podemos utilizar la 
distribución de Poisson para aproximar probabilidades binomiales intercambiando lo 
que definimos como éxito y fracaso, por lo tanto, cambiando p a un valor cercano a 0. 


Sea X una variable aleatoria binomial con distribución de probabilidad b(x; n, p). Cuan- 
do n = o, p — 0, y np "25 и permanece constante, 


b(x; n, p) => р(х; p). 


Capítulo 5 Algunas distribuciones de probabilidad discreta 


Ejemplo 5.19: | En cierta fábrica los accidentes ocurren con muy poca frecuencia. Se sabe que la proba- 


bilidad de un accidente en cualquier día dado es de 0.005, y que los accidentes son inde- 
pendientes entre sí. 


a) ¿Cuál es la probabilidad de que en un día de cualquier periodo determinado de 400 
días ocurra un accidente? 


b) ¿Cuál es la probabilidad de que ocurra un accidente a lo sumo en tres días de tal pe- 
riodo? 


Solución: Sea X una variable aleatoria binomial con n = 400 y p = 0.005. Por consiguiente, np = 


2. Si utilizamos la aproximación de Poisson, 
a PiX=b=*2=001y 


3 
b) P(X <3) = Y e7?2* Jx! = 0.857. 
x=0 И | 


Ejemplo 5.20: | En un proceso de fabricación donde se manufacturan productos de vidrio ocurren defec- 


tos o burbujas, lo cual ocasionalmente hace que la pieza ya no se pueda vender. Se sabe 
que, en promedio, 1 de cada 1000 artículos producidos tiene una o más burbujas. ¿Cuál 
es la probabilidad de que una muestra aleatoria de 8000 tenga menos de 7 artículos con 


burbujas? 


Solución: Se trata básicamente de un experimento binomial con n = 8000 y p = 0.001. Como p es 
muy cercana a cero y n es bastante grande, haremos la aproximación con la distribución 


de Poisson utilizando 


п = 


(8000)(0.001) = 8. 


Por lo tanto, si X representa el número de burbujas, tenemos 


6 


P(X < 7) = У (х; 8000, 0.001) = p(x;8) = 0.3134. 


x=0 


Ejercicios 


5.49 La probabilidad de que una persona que vive en 
cierta ciudad tenga un perro es de 0.3. Calcule la proba- 
bilidad de que la décima persona entrevistada al azar en 
esa ciudad sea la quinta que tiene un perro. 


5.50 Calcule la probabilidad de que una persona que 
lanza una moneda obtenga 

a) la tercera cara en el séptimo lanzamiento; 

b) la primera cara en el cuarto lanzamiento. 


5.51 Tres personas lanzan una moneda legal y el 
disparejo paga los cafés. Si todas las monedas tienen 
el mismo resultado, se lanzan de nuevo. Calcule la 
probabilidad de que se necesiten menos de 4 lanza- 
mientos. 


5.52 Un científico inocula a varios ratones, uno a 
la vez, el virus que produce una enfermedad, hasta que 
encuentra a 2 que contraen la enfermedad. Si la proba- 


bilidad de contraer la enfermedad es de 1/6, ¿cuál es 
la probabilidad de que tenga que inocular a 8 ratones? 


5.53 Un estudio de un inventario determina que, en 
promedio, el número de veces al día que se solicita un 
artículo específico en un almacén es 5. ¿Cuál es la proba- 
bilidad de que en un día determinado este artículo se pida 
a) más de 5 veces? 
b) ninguna vez? 
5.54 De acuerdo con un estudio publicado por un 
grupo de sociólogos de la Universidad de Massachusetts, 
Estados Unidos, casi dos terceras partes de los 20 mi- 
llones de personas que consumen Valium son mujeres. 
Suponga que esta cifra es una estimación válida y cal- 
cule la probabilidad de que en un determinado día la 
quinta prescripción de Valium que da un médico sea 
a) la primera prescripción de Valium para una mujer; 
b) la tercera prescripción de Valium para una mujer. 


Ejercicios 


5.55 La probabilidad de que una persona que estudia 
la carrera de piloto privado apruebe el examen escrito 
para obtener la licencia es de 0.7. Calcule la probabili- 
dad de que cierto estudiante apruebe el examen 

a) en el tercer intento; 

b) antes del cuarto intento. 


5.56 En cierto crucero ocurren, en promedio, 3 acci- 
dentes de tránsito al mes. ¿Cuál es la probabilidad de 
que en cualquier determinado mes en este crucero 

a) ocurran exactamente 5 accidentes? 

b) ocurran menos de 3 accidentes? 

с) ocurran al menos 2 accidentes? 


5.57 Un escritor de libros comete, en promedio, dos 
errores de procesamiento de texto por página en el pri- 
mer borrador de su libro. ¿Cuál es la probabilidad de 
que en la siguiente página cometa 

а) 4 о más errores? 

b) ningún error? 


5.58 Cierta área del este de Estados Unidos resulta 
afectada, en promedio, por 6 huracanes al año. Calcule 
la probabilidad de que para cierto año esta área resulte 
afectada por 

a) menos de 4 huracanes; 

b) cualquier cantidad entre 6 y 8 huracanes. 


5.59 Suponga que la probabilidad de que una deter- 
minada persona crea un rumor acerca de las transgre- 
siones de cierta actriz famosa es de 0.8. ¿Cuál es la 
probabilidad de que 
a) la sexta persona que escuche este rumor sea la 
cuarta en creerlo? 
b) la tercera persona que escuche este rumor sea la 
primera en creerlo? 


5.60 Se estima que el número promedio de ratas de 
campo por acre, en un campo de 5 acres de trigo, es 12. 
Calcule la probabilidad de que se encuentren menos de 
7 ratas de campo 

a) en un acre dado; 

b) en 2 de los siguientes 3 acres que se inspeccionen. 


5.61 Suponga que, en promedio, una persona en 1000 
comete un error numérico al preparar su declaración de 
impuestos. Si se seleccionan 10,000 formas al azar y se 
examinan, calcule la probabilidad de que 6, 7 u 8 de las 
formas contengan un error. 


5.62 Se sabe que la probabilidad de que un estudiante 
de preparatoria no pase la prueba de escoliosis (curva- 
tura de la espina dorsal) es de 0.004. De los siguientes 
1875 estudiantes que se revisan en búsqueda de esco- 
liosis, calcule la probabilidad de que 

a) menos de 5 no pasen la prueba; 

b) 8,90 10 no pasen la prueba. 
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5.63 Calcule la media y la varianza de la variable alea- 
toria X del ejercicio 5.58, que representa el número de 
huracanes que afectan cada año a cierta área del este 
de Estados Unidos. 


5.64 Calcule la media y la varianza de la variable 
aleatoria X del ejercicio 5.61, que representa el número 
de personas, de cada 10,000, que comete un error al 
preparar su declaración de impuestos. 


5.65 Un fabricante de automóviles se preocupa por 
una falla en el mecanismo de freno de un modelo es- 
pecífico. En raras ocasiones la falla puede causar una 
catástrofe al manejarlo a alta velocidad. La distribución 
del número de automóviles por año que experimentará 
la catástrofe es una variable aleatoria de Poisson con 
А = 5. 

а) ¿Cuál es la probabilidad de que, а lo sumo, 3 au- 
tomóviles por año de ese modelo específico sufran 
una catástrofe? 

b) ¿Cuál es la probabilidad de que más de un auto- 
móvil por año experimente una catástrofe? 


5.66 Los cambios en los procedimientos de los ae- 
ropuertos requieren una planeación considerable. Los 
índices de llegadas de los aviones son factores impor- 
tantes que deben tomarse en cuenta. Suponga que los 
aviones pequeños llegan a cierto aeropuerto, de acuerdo 
con un proceso de Poisson, con una frecuencia de 6 por 
hora. De esta manera, el parámetro de Poisson para las 
llegadas en un periodo de horas es и = бї. 

a) ¿Cuál es la probabilidad de que lleguen exacta- 
mente 4 aviones pequeños durante un periodo de 
una hora? 

b) ¿Cuál es la probabilidad de que lleguen al menos 4 
durante un periodo de una hora? 

c) Si definimos un día laboral como de 12 horas, 
¿cuál es la probabilidad de que al menos 75 avio- 
nes pequeños lleguen durante un día laboral? 


5.67 бе supone que el número de clientes que llegan 
por hora a ciertas instalaciones de servicio automotriz 
sigue una distribución de Poisson con media А = 7. 
a) Calcule la probabilidad de que lleguen más de 10 
clientes en un periodo de dos horas. 
b) ¿Cuál es el número medio de llegadas durante un 
periodo de 2 horas? 


5.68 Considere el ejercicio 5.62. ¿Cuál es el número 
promedio de estudiantes que no pasan la prueba? 


5.69 La probabilidad de que una persona muera al 
contraer una infección viral es de 0.001. De los si- 
guientes 4000 infectados con el virus, ¿cuál es el nú- 
mero promedio que morirá? 
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5.70 Una empresa compra lotes grandes de cierta 
clase de dispositivo electrónico. Utiliza un método que 
rechaza el lote completo si en una muestra aleatoria de 
100 unidades se encuentran 2 o más unidades defec- 
tuosas. 

a) ¿Cuál es el número promedio de unidades defec- 
tuosas que se encuentran en una muestra de 100 
unidades si el lote tiene 1% de unidades defec- 
tuosas? 

b) ¿Cuál es la varianza? 


5.71 бе sabe que para cierto tipo de alambre de cobre 
ocurren, en promedio, 1.5 fallas por milímetro. Si se 
supone que el número de fallas es una variable aleatoria 
de Poisson, ¿cuál es la probabilidad de que no ocurran 
fallas en cierta parte de un alambre que tiene 5 milí- 
metros de longitud? ¿Cuál es el número promedio de 
fallas en alguna parte de un alambre que tiene 5 milí- 
metros de longitud? 


5.72 Los baches en ciertas carreteras pueden ser 
un problema grave y requieren reparación constante- 
mente. Con un tipo específico de terreno y mezcla de 
concreto la experiencia sugiere que hay, en promedio, 2 
baches por milla después de cierta cantidad de uso. Se 
supone que el proceso de Poisson se aplica a la variable 
aleatoria “número de baches”. 
a) ¿Cuál es la probabilidad de que no aparezca más de 
un bache en un tramo de una milla? 
b) ¿Cuál es la probabilidad de que no aparezcan más 
de 4 baches en un tramo determinado de 5 millas? 


5.73 En ciudades grandes los administradores de los 
hospitales se preocupan por el flujo de personas en las 
salas de urgencias. En un hospital específico de una 
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5.77 Durante un proceso de producción, cada día se 
seleccionan al azar 15 unidades de la línea de ensamble 
para verificar el porcentaje de artículos defectuosos. A 
partir de información histórica se sabe que la probabi- 
lidad de tener una unidad defectuosa es de 0.05. Cada 
vez que se encuentran dos o más unidades defectuosas 
en la muestra de 15, el proceso se detiene. Este pro- 
cedimiento se utiliza para proporcionar una señal en 
caso de que aumente la probabilidad de unidades de- 
fectuosas. 

a) ¿Cuál es la probabilidad de que en un día deter- 
minado se detenga el proceso de producción? (Su- 
ponga 5% de unidades defectuosas). 

b) Suponga que la probabilidad de una unidad defec- 
tuosa aumenta a 0.07. ¿Cuál es la probabilidad de 
que en cualquier día no se detenga el proceso 
de producción? 


Capítulo 5 Algunas distribuciones de probabilidad discreta 


ciudad grande el personal disponible no puede alojar 
el flujo de pacientes cuando hay más de 10 casos de 
emergencia en una hora determinada. Se supone que la 
llegada de los pacientes sigue un proceso de Poisson y 
los datos históricos sugieren que, en promedio, llegan 
5 emergencias cada hora. 

a) ¿Cuál es la probabilidad de que en una hora de- 
terminada el personal no pueda alojar el flujo de 
pacientes? 

b) ¿Cuál es la probabilidad de que, durante un turno 
de 3 horas, lleguen más de 20 emergencias? 


5.74 бе sabe que 3% de las personas a las que se les 
revisa el equipaje en un aeropuerto lleva objetos cues- 
tionables. ¿Cuál es la probabilidad de que una serie de 
15 personas cruce sin problemas antes de que se atrape 
a una con un objeto cuestionable? ¿Cuál es el número 
esperado de personas que pasarán antes de que se de- 
tenga a una? 


5.75 La tecnología cibernética ha generado un am- 
biente donde los “robots” funcionan con el uso de mi- 
croprocesadores. La probabilidad de que un robot falle 
durante cualquier turno de 6 horas es de 0.10. ¿Cuál es 
la probabilidad de que un robot funcione a lo sumo 5 
turnos antes de fallar? 


5.76 Se sabe que la tasa de rechazo en las encuestas 
telefónicas es de aproximadamente 20%. Un reportaje 
del periódico indica que 50 personas respondieron a 
una encuesta antes de que una se rehusara a participar. 
a) Comente acerca de la validez del reportaje. Utilice 
una probabilidad en su argumento. 
b) ¿Cuál es el número esperado de personas encues- 
tadas antes de que una se rehúse a responder? 


5.78 Se considera utilizar una máquina automática 
de soldadura para un proceso de producción. Antes de 
comprarla se probará para verificar si tiene éxito en 
99% de sus soldaduras. Si no es así, se considerará que 
no es eficiente. La prueba se llevará a cabo con un pro- 
totipo que requiere hacer 100 soldaduras. La máquina 
se aceptará para la producción sólo si no falla en más 
de 3 soldaduras. 
a) ¿Cuál es la probabilidad de que se rechace una 
buena máquina? 
b) ¿Cuál es la probabilidad de que se acepte una má- 
quina ineficiente que solde bien el 95% de las veces? 


5.79 Una agencia de renta de automóviles en un ae- 
ropuerto local tiene 5 Ford, 7 Chevrolet, 4 Dodge, 3 
Honda y 4 Toyota disponibles. Si la agencia selecciona 
al azar 9 de estos automóviles para transportar delega- 
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dos desde el aeropuerto hasta el centro de convencio- 
nes de la ciudad, calcule la probabilidad de que rente 2 
Ford, 3 Chevrolet, 1 Dodge, 1 Honda y 2 Toyota. 


5.80 En un centro de mantenimiento que recibe llama- 
das de servicio de acuerdo con un proceso de Poisson 
entran, en promedio, 2.7 llamadas por minuto. Calcule 
la probabilidad de que 
a) no entren más de 4 llamadas en cualquier minuto; 
b) entren menos de 2 llamadas en cualquier minuto; 
с) entren más de 10 llamadas en un periodo de 5 mi- 
nutos. 


5.81 Una empresa de electrónica afirma que la pro- 
porción de unidades defectuosas de cierto proceso 
es de 5%. Un comprador sigue el procedimiento están- 
dar de inspeccionar 15 unidades elegidas al azar de un 
lote grande. En una ocasión específica el comprador 
encuentra 5 unidades defectuosas. 

a) ¿Cuál es la probabilidad de que esto ocurra, si es 
correcta la afirmación de que el 5% de los produc- 
tos son defectuosos? 

b) ¿Cómo reaccionaría usted si fuera el comprador? 


5.82 Un dispositivo electrónico de conmutación fa- 
lla ocasionalmente, pero se considera que es satisfac- 
torio si, en promedio, no comete más de 0.20 errores 
por hora. Se elige un periodo particular de 5 horas para 
probarlo. Si durante este periodo no ocurre más de un 
error, se considera que el funcionamiento del disposi- 
tivo es satisfactorio. 

a) ¿Cuál es la probabilidad de que, con base en la 
prueba, se considere que un dispositivo no funciona 
satisfactoriamente cuando en realidad sí lo hace? 
Suponga que se trata de un proceso de Poisson. 

b) ¿Cuál es la probabilidad de que un dispositivo se 
considere satisfactorio cuando, de hecho, el número 
medio de errores que comete es 0.25? De nue- 
vo suponga que se trata de un proceso de Poisson. 


5.83 Una empresa por lo general compra lotes gran- 
des de cierta clase de dispositivo electrónico. Utiliza un 
método que rechaza el lote completo si encuentra 2 o 
más unidades defectuosas en una muestra aleatoria de 
100 unidades. 
a) ¿Cuál es la probabilidad de que el método rechace 
un lote que tiene un 1% de unidades defectuosas? 
b) ¿Cuál es la probabilidad de que acepte un lote que 
tiene 5% de unidades defectuosas? 


5.84 El propietario de una farmacia local sabe que, en 
promedio, llegan a su farmacia 100 personas por hora. 
a) Calcule la probabilidad de que en un periodo de- 
terminado de 3 minutos nadie entre a la farmacia. 

b) Calcule la probabilidad de que en un periodo dado 
de 3 minutos entren más de 5 personas a la farmacia. 
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5.85 а) Suponga que lanza 4 dados. Calcule la proba- 
bilidad de obtener al menos un 1. 

b) Suponga que lanza 2 dados 24 veces. Calcule la 

probabilidad de obtener al menos uno (1, 1), es 
decir, un “ojos de serpiente”. 


5.86 Suponga que de 500 billetes de lotería que se 
venden, 200 le dan a ganar al comprador al menos el 
costo del billete. Ahora suponga que usted compra 5 
billetes. Calcule la probabilidad de ganar al menos el 
costo de 3 billetes. 


5.87 Las imperfecciones en los tableros de circuitos 
y los microcircuitos de computadora se prestan para un 
análisis estadístico. Un tipo particular de tablero con- 
tiene 200 diodos y la probabilidad de que falle alguno 
es de 0.03. 

a) ¿Cuál es el número promedio de fallas en los dio- 
dos? 

b) ¿Cuál es la varianza? 

с) El tablero funciona si no tiene diodos defectuosos. 
¿Cuál es la probabilidad de que un tablero fun- 
cione? 

5.88 El comprador potencial de un motor particular re- 
quiere (entre otras cosas) que éste encienda 10 veces con- 
secutivas. Suponga que la probabilidad de que encienda 
es de 0.990. Suponga que los resultados de intentos de 
encendido son independientes. 

a) ¿Cuál es la probabilidad de que el posible compra- 
dor acepte el motor después de sólo 10 encendidos? 

b) ¿Cuál es la probabilidad de que se tenga que in- 
tentar encenderlo 12 veces durante el proceso de 
aceptación? 

5.89 El esquema de aceptación para comprar lotes 
que contienen un número grande de baterías consiste 
en probar no más de 75 baterías seleccionadas al azar 
y rechazar el lote completo si falla una sola batería. 
Suponga que la probabilidad de encontrar una que falle 
es de 0.001. 

a) ¿Cuál es la probabilidad de que se acepte un lote? 

b) ¿Cuál es la probabilidad de que se rechace un lote 
en la vigésima prueba? 

с) ¿Cuál es la probabilidad de que se rechace en 10 o 
menos pruebas? 


5.90 Una empresa que perfora pozos petroleros opera 
en varios sitios y su éxito o fracaso es independiente de 
un sitio a otro. Suponga que la probabilidad de éxito en 
cualquier sitio específico es de 0.25. 

a) ¿Cuál es la probabilidad de que un perforador ba- 
rrene 10 sitios y tenga un éxito? 

b) El perforador se declarará en bancarrota si tiene 
que perforar 10 veces antes de que ocurra el pri- 
mer éxito. ¿Cuáles son las perspectivas de banca- 
rrota del perforador? 
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5.91 Considere la información del ejercicio de repaso 
5.90. El perforador cree que “dará en el clavo” si logra 
el segundo éxito durante o antes del sexto intento. ¿Cuál 
es la probabilidad de que el perforador “dé en el clavo”? 


5.92 Una pareja decide que continuará procreando hi- 
jos hasta tener dos hombres. Suponiendo que P(hombre) 
= 0.5, ¿cuál es la probabilidad de que su segundo niño 
sea su cuarto hijo? 


5.93 Por los investigadores se sabe que una de cada 
100 personas es portadora de un gen que lleva a la heren- 
cia de cierta enfermedad crónica. En una muestra alea- 
toria de 1000 individuos, ¿cuál es la probabilidad de que 
menos de 7 individuos porten el gen? Utilice la aproxi- 
mación de Poisson. Nuevamente con la aproximación de 
Poisson, determine cuál es el número promedio aproxi- 
mado de personas, de cada 1000, que portan el gen. 


5.94 Un proceso de fabricación produce piezas para 
componentes electrónicos. Se supone que la proba- 
bilidad de que una pieza salga defectuosa es de 0.01. 
Durante una prueba de esta suposición se obtiene una 
muestra al azar de 500 artículos y se encuentran 15 de- 
fectuosos. 

a) ¿Cuál es su respuesta ante la suposición de que 
1% de las piezas producidas salen defectuosas? 
Asegúrese de acompañar su comentario con un 
cálculo de probabilidad. 

b) Suponiendo que 1% de las piezas producidas salen 
con defecto, ¿cuál es la probabilidad de que sólo 
se encuentren 3 defectuosas? 

c) Resuelva de nueva cuenta los incisos a) y b) utili- 
zando la aproximación de Poisson. 


5.95 Un proceso de manufactura produce artícu- 
los en lotes de 50. Se dispone de planes de muestreo 
en los cuales los lotes se apartan periódicamente y 
se someten a cierto tipo de inspección. Por lo general se 
supone que la proporción de artículos defectuosos que 
resultan del proceso es muy pequeña. Para la empresa 
también es importante que los lotes que contengan ar- 
tículos defectuosos sean un evento raro. El plan actual 
de inspección consiste en elegir lotes al azar, obtener 
muestras periódicas de 10 en 50 artículos de un lote y, 
si ninguno de los muestreados está defectuoso, no se 
realizan acciones. 

a) Suponga que se elige un lote al azar y 2 de cada 50 
artículos tienen defecto. ¿Cuál es la probabilidad 
de que al menos uno en la muestra de 10 del lote 
esté defectuoso? 

b) A partir de su respuesta en el inciso a), comente 
sobre la calidad de este plan de muestreo. 

c) ¿Cuál es el número promedio de artículos defec- 
tuosos encontrados por cada 10 artículos de la 
muestra? 
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5.96 Considere la situación del ejercicio de repaso 
5.95. Se ha determinado que el plan de muestreo debe- 
ría ser lo suficientemente amplio como para que haya 
una probabilidad alta, digamos de 0.9, de que si hay 
tantos como 2 artículos defectuosos en el lote de 50 que 
se muestrea, al menos uno se encuentre en el muestreo. 
Con tales restricciones, ¿cuántos de los 50 artículos de- 
berían muestrearse? 


5.97 La seguridad nacional requiere que la tecnología 
de defensa sea capaz de detectar proyectiles o misiles 
ofensivos. Para que este sistema de defensa sea exitoso, 
serequieren múltiples pantallas de radar. Suponga que se 
usarán tres pantallas independientes y que la proba- 
bilidad de que cualquiera detecte un misil ofensivo es 
de 0.8. Es evidente que si ninguna pantalla detecta un 
misil ofensivo, el sistema no funciona y requiere me- 
jorarse. 
a) ¿Cuál es la probabilidad de que ninguna de las 
pantallas detecte un misil ofensivo? 
b) ¿Cuál es la probabilidad de que sólo una de las 
pantallas detecte el misil? 
c) ¿Cuál es la probabilidad de que al menos 2 de las 
3 pantallas detecten el misil? 


5.98 Suponga que es importante que el sistema ge- 
neral de defensa contra misiles sea lo más perfecto po- 
sible. 

a) Suponga que la calidad de las pantallas es la que se 
indica en el ejercicio de repaso 5.97. ¿Cuántas 
se requieren, entonces, para asegurar que la proba- 
bilidad de que el misil pase sin ser detectado sea 
de 0.0001? 

b) Suponga que se decide utilizar sólo 3 pantallas e 
intentar mejorar la capacidad de detección de las 
mismas. ¿Cuál debe ser la eficacia individual de 
las pantallas (es decir, la probabilidad de detec- 
ción), para alcanzar la eficacia que se requiere en 
el inciso a? 


5.99 Regrese al ejercicio de repaso 5.95a. Vuelva a 
calcular la probabilidad usando la distribución bino- 
mial. Comente su respuesta. 


5.100 En cierto departamento universitario de esta- 
dística hay dos vacantes. Cinco personas las solicitan; 
dos de ellas tienen experiencia con modelos lineales y 
una tiene experiencia con probabilidad aplicada. Al co- 
mité de selección se le indicó elegir a los 2 aspirantes 
aleatoriamente. 
a) ¿Cuál es la probabilidad de que los 2 elegidos sean 
los que tienen experiencia con modelos lineales? 
b) ¿Cuál es la probabilidad de que, de los 2 elegidos, 
uno tenga experiencia con modelos lineales y el 
otro con probabilidad aplicada? 


5.6 Posibles riesgos y errores conceptuales; relación con el material de otros capítulos 


5.101 El fabricante de un triciclo para niños ha reci- 
bido quejas porque su producto tiene defecto en los fre- 
nos. De acuerdo con el diseño del producto y muchas 
pruebas preliminares, se determinó que la probabilidad 
del tipo de defecto reportado era 1 en 10,000 (es decir, de 
0.0001). Después de una minuciosa investigación 
de las quejas se determinó que durante cierto periodo 
se eligieron aleatoriamente 200 artículos de la produc- 
ción, de los cuales 5 tuvieron frenos defectuosos. 
a) Comente sobre la afirmación de “uno en 10,000” 
del fabricante. Utilice un argumento probabilístico. 
Use la distribución binomial para sus cálculos. 
b) Repita el inciso a utilizando la aproximación de 
Poisson. 


5.102 Proyecto de grupo: Separe la clase en dos 
grupos aproximadamente del mismo tamaño. Cada 
uno de los estudiantes del grupo 1 lanzará una moneda 
10 veces (n,) y contará el número de caras resultan- 
tes. Cada uno de los estudiantes del grupo 2 lanzará 
una moneda 40 veces (n,) y también contará el número 
de caras obtenidas. Los miembros de cada grupo deben 
calcular de manera individual la proporción de caras ob- 
servadas, que es una estimación de p, la probabilidad de 
obtener una cara. De esta manera, habrá un conjunto 
de valores de p, (del grupo 1) y un conjunto de valores de 
p, (del grupo 2). Todos los valores de p, y p, son estima- 
ciones de 0.5, que es el valor verdadero de la probabili- 
dad de obtener una cara de una moneda legal. 
a) ¿Cuál conjunto de valores se acerca con mayor 
consistencia a 0.5, el de p, o el de p,? Considere 
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la demostración del teorema 5.1 de la página 147 
con respecto a las estimaciones del parámetro p = 
0.5. Los valores de р, se obtuvieron con n = п, 
= 10 y los valores de p, se obtuvieron con n = n, = 
40. Si se utiliza la notación de la demostración, las 
estimaciones están dadas por 


х Д ЯЛ 


nı UN 


pı 


> 


donde 1.,..., Li son ceros y unos y n, = 10, y 


2 l +++, 
p = ы, 
П? П? 


donde 7,,...,7, son nuevamente ceros y unos y n, = 
40. | 
b) Remítase nuevamente al teorema 5.1 y demuestre 
que 
Е(р\) = E) =p = 05. 
› _ 0% 
с) Demuestre que с = ET es 4 veces el valor de 
2 _ Ох, 
P2 na 
de p, del grupo 2 se acercan con mayor consisten- 
cia al valor verdadero, p = 0.5, que los valores de 


p, del grupo 1. 


. Explique, además, por qué los valores 


Aprenderá mucho más sobre la estimación de paráme- 
tros a partir del capítulo 9. Ahí pondremos más énfasis 
en la importancia de la media y la varianza de un esti- 
mador de un parámetro. 


5.6 Posibles riesgos y errores conceptuales; relación 


con el material de otros capítulos 


Las distribuciones discretas estudiadas en este capítulo ocurren con mucha frecuencia 
en los escenarios de la ingeniería, así como en los de las ciencias biológicas y físicas. Es 
evidente que los ejemplos y los ejercicios sugieren esto. Los planes de muestreo indus- 
trial y muchas de las decisiones en ingeniería se basan en las distribuciones binomial y 
de Poisson, así como en la distribución hipergeométrica. Mientras que las distribuciones 
binomial negativa y geométrica se utilizan en menor grado, también tienen aplicaciones. 
En específico, una variable aleatoria binomial negativa se puede ver como una mezcla 
de variables aleatorias gamma y de Poisson (la distribución gamma se estudiará en el 
capítulo 6). 

A pesar de las múltiples aplicaciones que estas distribuciones tienen en la vida real, 
podrían utilizarse de manera incorrecta, a menos que el científico sea prudente y cui- 
dadoso. Desde luego, cualquier cálculo de probabilidad para las distribuciones que se 
estudiaron en este capítulo se realiza bajo el supuesto de que se conoce el valor del pa- 
rámetro. Las aplicaciones en el mundo real a menudo resultan en un valor del parámetro 
que se puede “desplazar” debido a factores que son difíciles de controlar en el proceso, 
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o debido a intervenciones en el proceso que no se han tomado en cuenta. Por ejemplo, 
en el ejercicio de repaso 5.77 se utilizó “información histórica”; sin embargo, ¿el pro- 
ceso actual es el mismo que aquel en que se recabaron los datos históricos? El uso de 
la distribución de Poisson tiene incluso más posibilidades de enfrentar esta dificultad. 
Por ejemplo, en el ejercicio de repaso 5.80 las preguntas de los incisos a, b y c se basan 
en el uso de и = 2.7 llamadas por minuto. Con base en los registros históricos éste es el 
número de llamadas que se reciben “en promedio”. Pero en ésta y muchas otras aplica- 
ciones de la distribución de Poisson hay momentos desocupados y momentos ajetreados, 
de manera que se espera que haya momentos en que las condiciones para el proceso de 
Poisson parezcan cumplirse, cuando en realidad no lo hacen. Por consiguiente, los 
cálculos de probabilidad podrían ser incorrectos. En el caso de la distribución binomial, 
la condición que podría fallar en ciertas aplicaciones (además de la falta de constancia 
de p) es la suposición de independencia, estipulando que los experimentos de Bernoulli 
son independientes. 

Una de las aplicaciones incorrectas más célebres de la distribución binomial ocurrió 
en la temporada de béisbol de 1961, cuando Mickey Mantle y Roger Maris se enfrasca- 
ron en una batalla amistosa por romper el récord de todos los tiempos de 60 jonrones es- 
tablecido por Babe Ruth. Un famoso artículo de una revista predijo, con base en la teoría 
de la probabilidad, que Mantle rompería el récord. La predicción estaba fundamentada 
en un cálculo de probabilidad en el que se utilizó la distribución binomial. El error clá- 
sico cometido fue la estimación del parámetro p (uno para cada jugador) con base en la 
frecuencia histórica relativa de jonrones a lo largo de la carrera de los 2 jugadores. Maris, 
a diferencia de Mantle, no había sido un jonronero prodigioso antes de 1961, de manera 
que su estimado de p fue bastante bajo. Como resultado de esto se determinó que Mantle 
tenía más probabilidades que Maris de romper el récord, pero quien logró romperlo al 
final fue este último. 


Capítulo 6 


Algunas distribuciones continuas 
de probabilidad 


6.1 Distribución uniforme continua 


Una de las distribuciones continuas más simples de la estadística es la distribución 
uniforme continua. Esta distribución se caracteriza por una función de densidad que es 
“plana”, por lo cual la probabilidad es uniforme en un intervalo cerrado, digamos [A, В]. 
Aunque las aplicaciones de la distribución uniforme continua no son tan abundantes 
como las de otras distribuciones que se presentan en este capítulo, es apropiado para el 
principiante que comience esta introducción a las distribuciones continuas con la distri- 
bución uniforme. 


Distribución 
uniforme 


La función de densidad de la variable aleatoria uniforme continua X en el intervalo 
[А, B] es 


1 
=>, AÁS<SxS<B, 
f(x;A, В) = ta И 


0, еп otro caso. 


La función de densidad forma un rectángulo con base В — A y altura constante к=. 
Como resultado, la distribución uniforme a menudo se conoce como distribución rec- 
tangular. Sin embargo, observe que el intervalo no siempre es cerrado: [A, В]; también 
puede ser (A, B). En la figura 6.1 se muestra la función de densidad para una variable 
aleatoria uniforme en el intervalo [1, 3]. 

Resulta sencillo calcular las probabilidades para la distribución uniforme debido a la 
naturaleza simple de la función de densidad. Sin embargo, observe que la aplicación de 
esta distribución se basa en el supuesto de que la probabilidad de caer en un intervalo 
de longitud fija dentro de [A, B] es constante. 


Ejemplo 6.1: | Suponga que el tiempo máximo que se puede reservar una sala de conferencias grande 


de cierta empresa son cuatro horas. Con mucha frecuencia tienen conferencias extensas 
y breves. De hecho, se puede suponer que la duración X de una conferencia tiene 
una distribución uniforme en el intervalo [0, 4]. 
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X 


0 1 3 


Figura 6.1: Función de densidad para una variable aleatoria en el intervalo [1, 3]. 


a) ¿Cuál es la función de densidad de probabilidad? 


b) ¿Cuál es la probabilidad de que cualquier conferencia determinada dure al menos 
3 horas? 


Solución: a) La función de densidad apropiada para la variable aleatoria X distribuida uniforme- 
mente en esta situación es 


0O<x<4, 


1 
4 , 
0, en otro caso. 


fœ) = 


Teorema 6.1: La media y la varianza de la distribución uniforme son 


AEB BA 
МЕ ye a 


Las demostraciones de los teoremas se dejan al lector. Véase el ejercicio 6.1 de la pági- 
na 185. 


6.2 Distribución normal 


La distribución de probabilidad continua más importante en todo el campo de la estadís- 
tica es la distribución normal. Su gráfica, denominada curva normal, es la curva con 
forma de campana de la figura 6.2, la cual describe de manera aproximada muchos fenó- 
menos que ocurren en la naturaleza, la industria y la investigación. Por ejemplo, las 
mediciones físicas en áreas como los experimentos meteorológicos, estudios de la precipi- 
tación pluvial y mediciones de partes fabricadas a menudo se explican más que adecua- 
damente con una distribución normal. Además, los errores en las mediciones científicas 
se aproximan muy bien mediante una distribución normal. En 1733, Abraham DeMoivre 
desarrolló la ecuación matemática de la curva normal, la cual sentó las bases sobre 
las que descansa gran parte de la teoría de la estadística inductiva. La distribución nor- 
mal a menudo se denomina distribución gaussiana en honor de Karl Friedrich Gauss 
(1777-1855), quien también derivó su ecuación a partir de un estudio de errores en me- 
diciones repetidas de la misma cantidad. 
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жр 
үл X 


Figura 6.2: La curva normal. 


Una variable aleatoria continua X que tiene la distribución en forma de campana de 
la figura 6.2 se denomina variable aleatoria normal. La ecuación matemática para la 
distribución de probabilidad de la variable normal depende de los dos parámetros H y с, 
su media y su desviación estándar, respectivamente. Por ello, denotamos los valores de 
la densidad de X por n(x; pu, о). 


Distribución 
normal 


La densidad de la variable aleatoria normal X, con media и y varianza ©?, es 


1 Я 2 
е T o <x <o, 


1 
n(x; u, о) = Bre 


donde т = 3.14159... y e = 2.71828... 


Una vez que se especifican 4 y с, la curva normal queda determinada por completo. Por 
ejemplo, si u = 50 y с = 5, entonces se pueden calcular las ordenadas n(x; 50, 5) para 
diferentes valores de x y dibujar la curva. En la figura 6.3 aparecen dos curvas normales 
que tienen la misma desviación estándar pero diferentes medias. Las dos curvas son 
idénticas en forma, pero están centradas en diferentes posiciones a lo largo del eje ho- 
rizontal. 


01 = 02 


H H2 


Figura 6.3: Curvas normales con 4, < H, y O, = с, 
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07 


© 


Ш = Ш ds 


Figura 6.4: Curvas normales con 1, = H, y O, < O, 


En la figura 6.4 se muestran dos curvas normales con la misma media pero con 
desviaciones estándar diferentes. Aquí se observa que las dos curvas están centradas 
exactamente en la misma posición sobre el eje horizontal; sin embargo, la curva con la 
mayor desviación estándar es más baja y más extendida. Recuerde que el área bajo una 
curva de probabilidad debe ser igual a 1 y, por lo tanto, cuanto más variable sea el con- 
junto de observaciones, más baja y más ancha será la curva correspondiente. 

La figura 6.5 muestra dos curvas normales que tienen diferentes medias y diferentes 
desviaciones estándar. Evidentemente, están centradas en posiciones diferentes sobre el 
eje horizontal y sus formas reflejan los dos valores diferentes de с. 


О, 


02 


Figura 6.5: Curvas normales con 4, < H, Y O, < с, 


Con base en lo que observamos en las figuras 6.2 a 6.5, y en el examen de la prime- 
ra y la segunda derivadas de п (x; р, с), listamos las siguientes propiedades de la curva 
normal: 


1. La moda, que es el punto sobre el eje horizontal donde la curva tiene su punto 
máximo, ocurre en x = р. 
2. La curva es simétrica alrededor de un eje vertical a través de la media pu. 


3. La curva tiene sus puntos de inflexión en x = р + O, es cóncava hacia abajo 51 
p=0<X< u + о, y es cóncava hacia arriba en otro caso. 
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4. La curva normal se aproxima al eje horizontal de manera asintótica, conforme 
nos alejamos de la media en cualquier dirección. 


5. El área total bajo la curva y sobre el eje horizontal es igual a uno. 


Teorema 6.2: Га media y la varianza de п (х; u, с) son y y о, respectivamente. Por lo tanto, la des- 
viación estándar es O. 


Prueba: Para evaluar la media primero calculamos 


E(X -юй= | EH dx 


х VW2TO 


Al establecer que z = (x— 1)/0 y dx = с dz, obtenemos 


E(X —H)= ze 3% dz =0, 


1 / di 
V2T Jo 
dado que la integral anterior es una función impar de z. Al aplicar el teorema 4.5 de la 
página 128 concluimos que 


EX) = р 


La varianza de la distribución normal es dada por 
1 d 1 2 
EX = ш? =-= | х = ue TOT dy, 
„ж Уто A м 


De nuevo, al establecer que z = (х – р) /су dx = O dz, obtenemos 


2 оо 2 
EX —pw?] - 5] ze de, 


Al integrar por partes con u = z y dv = ze73*/2 dz de modo que du = суу = е7, 
encontramos que 


2 оо fs 2 
EIX -Wl === (е^ + / е? а) = 0200 + 1) = о?. 
=ош —оо 

Muchas variables aleatorias tienen distribuciones de probabilidad que se pueden 
describir de forma adecuada mediante la curva normal, una vez que se especifiquen и y 
o°. En este capítulo supondremos que se conocen estos dos parámetros, quizás a partir 
de investigaciones anteriores. Más adelante haremos inferencias estadísticas cuando se 
desconozcan ру о? y se estimen а partir de los datos experimentales disponibles. 

Anteriormente señalamos el papel que desempeña la distribución normal como una 
aproximación razonable de variables científicas en experimentos de la vida real. Hay 
otras aplicaciones de la distribución normal que el lector apreciará a medida que avance 
en el estudio de este libro. La distribución normal tiene muchas aplicaciones como dis- 
tribución limitante. En ciertas condiciones, la distribución normal ofrece una buena 
aproximación continua a las distribuciones binomial e hipergeométrica. El caso de 
la aproximación a la distribución binomial se examina en la sección 6.5. En el capítulo 8 
el lector aprenderá acerca de las distribuciones muestrales. Resulta que la distribución 
limitante de promedios muestrales es normal, lo que brinda una base amplia para la 
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inferencia estadística, que es muy valiosa para el analista de datos interesado en la estima- 
ción y prueba de hipótesis. Las teorías de áreas importantes como el análisis de varianza 
(capítulos 13, 14 y 15) y el control de calidad (capítulo 17) se basan en suposiciones que 
utilizan la distribución normal. 

En la sección 6.3 se ofrecen ejemplos para demostrar cómo se utilizan las tablas de 
la distribución normal. En la sección 6.4 continúan los ejemplos de aplicaciones de la 
distribución normal. 


6.3 Áreas bajo la curva normal 


La curva de cualquier distribución continua de probabilidad o función de densidad se 
construye de manera que el área bajo la curva limitada por las dos ordenadas x = x, y 
x = x, sea igual a la probabilidad de que la variable aleatoria X tome un valor entre x = x, 
y x = x, Por consiguiente, para la curva normal de la figura 6.6, 


X2 1 X2 | 2 
P(x <X < x2) - | n(x; р, 0) dx = = | e7 зет -№) ах, 
х 


Ж y2T0 Jx, i 


es representada por el área de la región sombreada. 


X 
X% H X2 


Figura 6.6: P(x, < X < x,) = área de la región sombreada. 


En las figuras 6.3, 6.4 y 6.5 vimos cómo la curva normal depende de la media y de 
la desviación estándar de la distribución que se está estudiando. El área bajo la curva 
entre cualesquiera dos ordenadas también debe depender de los valores р y с. Esto es 
evidente en la figura 6.7, donde sombreamos las regiones que corresponden a P(x, < X 
< x,) para dos curvas con medias y varianzas diferentes. P(x, < X < x,), donde X es la 
variable aleatoria que describe la distribución A, se indica por el área sombreada más 
oscura debajo de la curva de A. Si X es la variable aleatoria que describe la distribución B, 
entonces Р(х, < X < x,) es dada por toda la región sombreada. Evidentemente, las dos 
regiones sombreadas tienen tamaños diferentes; por lo tanto, la probabilidad asociada 
con cada distribución será diferente para los dos valores dados de X. 

Existen muchos tipos de programas estadísticos que sirven para calcular el área bajo 
la curva normal. La dificultad que se enfrenta al resolver las integrales de funciones de 
densidad normal exige tabular las áreas de la curva normal para una referencia rápida. 
Sin embargo, sería inútil tratar de establecer tablas separadas para cada posible valor de 
H y с. Por fortuna, podemos transformar todas las observaciones de cualquier variable 
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Definición 6.1: 


X 
Хч Хә 


Figura 6.7: Р(х, < X < x,) para diferentes curvas normales. 


aleatoria normal X en un nuevo conjunto de observaciones de una variable aleatoria nor- 
mal Z con media 0 y varianza 1. Esto se puede realizar mediante la transformación 


Siempre que X tome un valor x, el valor correspondiente de Z es dado por z = 
(х — р) /с. Por lo tanto, si X cae entre los valores x = x, y x = х„ la variable aleatoria Z 
caerá entre los valores correspondientes z = (1, -mf/0 y z, = (х, – 1)/0. En conse- 
cuencia, podemos escribir 


Ï X2 2 1 Z2 _2 
Р(х <X< x)= == | 270-0 dy = — ez dz 


20 Jx V2T Ja 


22 
z. n(z;0, 1) = Р(1< Z < 2), 


1 
donde Z se considera una variable aleatoria normal con media O y varianza 1. 


La distribución de una variable aleatoria normal con media 0 y varianza 1 se llama 
distribución normal estándar. 


Las distribuciones original y transformada se ilustran en la figura 6.8. Como todos los 
valores de X que caen entre x, y x, tienen valores z correspondientes entre z, y z,, el área 
bajo la curva X entre las ordenadas x = x, y x = x, de la figura 6.8 es igual al área bajo 
la curva Z entre las ordenadas transformadas z = z, y Z = 2,. 

Ahora hemos reducido el número requerido de tablas de áreas de curva normal a 
una, la de la distribución normal estándar. La tabla A.3 indica el área bajo la curva nor- 
mal estándar que corresponde a P(Z < z) para valores de z que van de -3.49 а 3.49. Para 
ilustrar el uso de esta tabla calculemos la probabilidad de que Z sea menor que 1.74. 
Primero, localizamos un valor de z igual a 1.7 en la columna izquierda, después nos 
movemos a lo largo del renglón hasta la columna bajo 0.04, donde leemos 0.9591. Por 
lo tanto, P(Z < 1.74) = 0.9591. Para calcular un valor z que corresponda a una probabi- 
lidad dada se invierte el proceso. Por ejemplo, se observa que el valor z que deja un área 
de 0.2148 bajo la curva a la izquierda de z es -0.79. 
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Хү X2 H 21 220 


Figura 6.8: Distribuciones normales original у transformada. 


Ejemplo 6.2: | Dada una distribución normal estándar, calcule el área bajo la curva que se localiza 


a) ala derecha de z = 1.84, y 


b) entre z =-1.97 y z = 0.86. 


Figura 6.9: Áreas para el ejemplo 6.2. 


Solución: Véase la figura 6.9 para las áreas específicas. 


a) El área en la figura 6.9a a la derecha de z = 1.84 es igual a 1 menos el área en la tabla 
А.З a la izquierda de z = 1.84, a saber, 1 – 0.9671 = 0.0329. 


b) El área en la figura 6.9р entre z = —1.97 у z = 0.86 es igual al área a la izquierda de 
z = 0.86 menos el área a la izquierda de z = –1.97. A partir de la tabla A.3 encontra- 
mos que el área que se desea es 0.8051 — 0.0244 = 0.7807. И | 


6.3 Áreas bajo la curva normal 179 


Ejemplo 6.3: | Dada una distribución normal estándar, calcule el valor de k tal que 


a) P(Z > k) = 0.3015, y 
b) P(k < Z < -0.18) = 0.4197. 


0.3015 0.4197 
Ok x k -0.18 
a) b) 


Figura 6.10: Áreas para el ejemplo 6.3. 


Solución: La distribución y las áreas deseadas se muestran en la figura 6.10. 


a) En la figura 6.10a vemos que el valor k que deja un área de 0.3015 a la derecha debe 
dejar entonces un área de 0.6985 a la izquierda. De la tabla А.3 se sigue que 
К= 0.52. 

b) En la tabla А.З observamos el área total a la izquierda de —0.18 es igual a 0.4286. En 
la figura 6.10b vemos que el área entre k y 0.18 es 0.4197, de manera que el área 


a la izquierda de k debe ser 0.4286 — 0.4197 = 0.0089. Por lo tanto, a partir de la 
tabla A.3 tenemos k = -2.37. И | 


Ejemplo 6.4: | Dada una variable aleatoria X que tiene una distribución normal con и = 50 y с = 10, 
calcule la probabilidad de que X tome un valor entre 45 y 62. 


=05 0 1.2 


Figura 6.11: Área para el ejemplo 6.4. 


Solución: Los valores z que corresponden a x, = 45 y x, = 62 son 


45—50 
Zz = 10 = —0.5 y z2 = 


62—50 _ 


_— =12. 
10 
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Por lo tanto, 
P(45 < X < 62) = P(—0.5 < Z < 1.2). 


P(20.5 < Z < 1.2) se muestra mediante el área de la región sombreada de la figura 6.11. 
Esta área se puede calcular restando el área a la izquierda de la ordenada z = —0.5 de 
toda el área a la izquierda de z = 1.2. Si usamos la tabla A.3, tenemos 
Р(45 < X < 62) = P(—0.5 < Z < 1.2) =P(Z <1.2) — P (Z <-—0.5) 
= 0.8849 — 0.3085 = 0.5764. J 


Ejemplo 6.5: | Dado que X tiene una distribución normal con u = 300 y с = 50, calcule la probabilidad 


Solución: 


de que X tome un valor mayor que 362. 

La distribución de probabilidad normal que muestra el área sombreada que se desea se 
presenta en la figura 6.12. Para calcular P(X > 362) necesitamos evaluar el área bajo la 
curva normal a la derecha de x = 362. Esto se puede realizar transformando x = 362 al 
valor z correspondiente, obteniendo el área a la izquierda de z de la tabla A.3 y después 
restando esta área de 1. Encontramos que 


_ 362—300 
к= 0 


= 1.24. 


De ahí, 
Р(Х > 362) =P(Z > 1.24) = 1— Р(Х < 1.24) = 1 0.8925 = 0.1075. J 


300 362 


Figura 6.12: Área para el ejemplo 6.5. 


De acuerdo con el teorema de Chebyshev en la página 137, la probabilidad de que 
una variable aleatoria tome un valor dentro de 2 desviaciones estándar de la media es 
de por lo menos 3/4. Si la variable aleatoria tiene una distribución normal, los valores z 
que corresponden ах, = 1-20 y x, = р + 20 se calculan fácilmente y son 


= 2. 


=20)= == 
T y „= 
С С 


De ahí, 
P(p-=20<X< uy +20) =P(-2<Z <2) =P(Z<2)-P(Z< -2) 
= 0.9772 — 0.0228 = 0.9544, 


que es una afirmación mucho más firme que la que se establece mediante el teorema de 
Chebyshev. 
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Uso de la curva normal a la inversa 


En ocasiones se nos pide calcular el valor de z que corresponde a una probabilidad espe- 
cífica que cae entre los valores que se listan en la tabla A.3 (véase el ejemplo 6.6). Por 
conveniencia, siempre elegiremos el valor z que corresponde a la probabilidad tabular 
que está más cerca de la probabilidad que se especifica. 

Los dos ejemplos anteriores se resolvieron al ir primero de un valor de x a un valor z 
y después calcular el área que se desea. En el ejemplo 6.6 invertimos el proceso y co- 
menzamos con un área o probabilidad conocida, calculamos el valor z y después deter- 
minamos x reacomodando la fórmula 


-p 


Ж 
z = ——— рага obtener х = о: + р. 
с 


Ејетріо 6.6: | Dada una distribución normal con u = 40 y O = 6, calcule el valor de х que tiene 


a) 45% del área a la izquierda, y 


b) 14% del área a la derecha. 


40 40 
a) b) 


Figura 6.13: Áreas para el ejemplo 6.6. 


Solución: a) En la figura 6.13a se sombrea un área de 0.45 a la izquierda del valor x deseado. Ne- 
cesitamos un valor z que deje un área de 0.45 a la izquierda. En la tabla А.З encontra- 
mos P(Z < -0.13) = 0.45, es decir, que el valor z que se desea es -0.13. Por lo tanto, 


x = (6)(—0.13) + 40 = 39.22. 


b) En la figura 6.13b sombreamos un área igual a 0.14 a la derecha del valor x deseado. 
Esta vez necesitamos un valor z que deje 0.14 del área a la derecha y, por lo tanto, 
un área de 0.86 a la izquierda. De nuevo, a partir de la tabla A.3 encontramos P(Z < 
1.08) = 0.86, así que el valor z deseado es 1.08 y 


x = (6)(1.08) + 40 = 46.48. 3 
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6.4 Aplicaciones de la distribución normal 


En los siguientes ejemplos se abordan algunos de los muchos problemas en los que se 
puede aplicar la distribución normal. El uso de la curva normal para aproximar probabi- 
lidades binomiales se estudia en la sección 6.5. 


Ejemplo 6.7: | Cierto tipo de batería de almacenamiento dura, en promedio, 3.0 años, con una desviación 
estándar de 0.5 años. Suponga que la duración de la batería se distribuye normalmente y 
calcule la probabilidad de que una batería determinada dure menos de 2.3 años. 

Solución: Empiece construyendo un diagrama como el de la figura 6.14, que muestra la distribu- 
ción dada de la duración de las baterías y el área deseada. Para calcular la P(X < 2.3) 
necesitamos evaluar el área bajo la curva normal a la izquierda de 2.3. Esto se logra 
calculando el área a la izquierda del valor z correspondiente. De donde encontramos que 


2.3 =3 
= = 


—1.4, 
0.5 
y entonces, usando la tabla A.3, tenemos 
Р(Х < 2.3) =P(Z< —1.4) = 0.0808. И 
с = 0.5 с = 40 
23 3 х 778 800 834 
Figura 6.14: Área para el ejemplo 6.7. Figura 6.15: Área para el ejemplo 6.8. 


Ejemplo 6.8 | Una empresa de material eléctrico fabrica bombillas de luz cuya duración, antes de que- 
marse, se distribuye normalmente con una media igual a 800 horas y una desviación 
estándar de 40 horas. Calcule la probabilidad de que una bombilla se queme entre 778 y 
834 horas. 
Solución: La distribución de vida de las bombillas se ilustra en la figura 6.15. Los valores z que 
corresponden а x, = 778 y x, = 834 son 
_ 778—800 _ 834 — 800 
= A 


p 055 y 22 = q — = 085. 


Por lo tanto, 


P(178 < X < 834) = P(— 0.55 < Z < 0.85) = P (Z < 0.85) — P (Z < — 0.55) 
= 0.8023 — 0.2912 = 0.5111. 3 


Ejemplo 6.9: |En un proceso industrial el diámetro de un cojinete de bolas es una medida importante. 
El comprador establece que las especificaciones en el diámetro sean 3.0 + 0.01 cm. Esto 
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implica que no se aceptará ninguna parte que no cumpla estas especificaciones. Se sabe 
que en el proceso el diámetro de un cojinete tiene una distribución normal con media 
H = 3.0 y una desviación estándar с = 0.005. En promedio, ¿cuántos de los cojinetes 
fabricados se descartarán? 

Solución: La distribución de los diámetros se ilustra en la figura 6.16. Los valores que corresponden 
a los límites especificados son x, = 2.99 y x, = 3.01. Los valores z correspondientes son 


2.99 — 3.0 3.01 3.0 
и р ПЕ она PR] 
0.005 Oy 22 0 


= 0.005 


Por lo tanto, 


PQ.99<X < 3.01) =P(-2.0<Z < 2.0). 


A partir de la tabla А.З, P(Z < —2.0) = 0.0228. Debido a la simetría de la distribución 
normal, encontramos que 


P(Z < —2.0) + P (Z > 2.0) = 2(0.0228) = 0.0456. 


Como resultado se anticipa que, en promedio, se descartarán 4.56% de los cojinetes fa- 
bricados. 2 


с = 0.005 7 = 0:2 


0.0228 0.0228 0.025 0.025 


2.99 3.0 3.01 ds 1.108 1.500 1.892 


Figura 6.16: Área para el ejemplo 6.9. Figura 6.17: Especificaciones para el ejemplo 6.10. 


Ejemplo 6.10: | Se utilizan medidores para rechazar todos los componentes en los que cierta dimensión 
no esté dentro de la especificación 1.50 + d. Se sabe que esta medida se distribuye nor- 
malmente con una media de 1.50 y una desviación estándar de 0.2. Determine el valor d 
tal que las especificaciones “cubran” 95% de las mediciones. 
Solución: A partir de la tabla A.3 sabemos que 


P(-1.96 < Z < 1.96) = 0.95. 
Por lo tanto, 
_ (1.50 + d) = 1.50 


1.96 
0.2 | 


de la que obtenemos 


а = (0.21(1.96)= 0.392. 


En la figura 6.17 se muestra una ilustración de las especificaciones. JJ 
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Ejemplo 6.11: | Cierta máquina fabrica resistencias eléctricas que tienen una resistencia media de 40 ohms 


y una desviación estándar de 2 ohms. Si se supone que la resistencia sigue una distribu- 
ción normal y que se puede medir con cualquier grado de precisión, ¿qué porcentaje de 
resistencias tendrán una resistencia que exceda 43 ohms? 


Solución: Se obtiene un porcentaje multiplicando la frecuencia relativa por 100%. Como la frecuen- 
cia relativa para un intervalo es igual a la probabilidad de caer en el intervalo, debemos 
calcular el área a la derecha de x = 43 en la figura 6.18. Esto se puede hacer transforman- 
do x = 43 al valor z correspondiente, con lo cual se obtiene el área a la izquierda de z de 
la tabla A.3, y después se resta esta área de 1. Encontramos que 

43 — 40 
= = 1.5. 
í 2 
Por lo tanto, 
P(X > 43) =P(Z > 1.5)=1—P(Z < 1.5) = 1 — 0.9332 = 0.0668. 
Así, 6.68% de las resistencias tendrán una resistencia que exceda 43 ohms. И | 
с = 2.0 = 2.0 
40 43 úl 40 43.5 
Figura 6.18: Área para el ejemplo 6.11. Figura 6.19: Área para el ejemplo 6.12. 


Ejemplo 6.12: | Calcule el porcentaje de resistencias que excedan 43 ohms para el ejemplo 6.11 si la 


Solución: 


resistencia se mide al ohm más cercano. 

Este problema difiere del ejemplo 6.11 en que ahora asignamos una medida de 43 ohms 
a todos los resistores cuyas resistencias sean mayores que 42.5 y menores que 43.5. Lo 
que estamos haciendo realmente es aproximar una distribución discreta por medio de 
una distribución continua normal. El área que se requiere es la región sombreada a la 


derecha de 43.5 en la figura 6.19. Encontramos ahora que 
43.5 — 4 
PE = =1Л8, 


En consecuencia, 
P(X > 43.5) =P(Z > 1.75) =1 — P(Z < 1.75) =1 — 0.9599 = 0.0401. 


Por lo tanto, 4.01% de las resistencias exceden 43 ohms cuando se miden al ohm más 
cercano. La diferencia 6.68% — 4.01% = 2.67% entre esta respuesta y la del ejem- 
plo 6.11 representa todos los valores de resistencias mayores que 43 y menores que 43.5, 
que ahora se registran como de 43 ohms. 
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Ejemplo 6.13: | La calificación promedio para un examen es 74 y la desviación estándar es 7. Si 12% del 


Solución: 


Figura 6.20: Área para el ejemplo 6.13. 


grupo obtiene A y las calificaciones siguen una curva que tiene una distribución normal, 
¿cuál es la A más baja posible y la B más alta posible? 

En este ejemplo comenzamos con un área de probabilidad conocida, calculamos el valor 
z y después determinamos х con la fórmula x = øz + u. Un área de 0.12, que correspon- 
de a la fracción de estudiantes que reciben A, está sombreada en la figura 6.20. Necesi- 
tamos un valor z que deje 0.12 del área a la derecha y, por lo tanto, un área de 0.88 a la 
izquierda. A partir de la tabla А.З, Р(Х < 1.18) tiene el valor más cercano a 0.88, de ma- 
nera que el valor z que se desea es 1.18. En consecuencia, 


х = (7)(1.18) + 74 = 82.26. 


Por lo tanto, la A más baja es 83 y la B más alta es 82. 


0.6 


0.12 
74 74D6 


Figura 6.21: Área para el ejemplo 6.14. 


Ejemplo 6.14: | Remítase al ejemplo 6.13 y calcule el sexto decil. 


Solución: 


El sexto decil, escrito como D, es el valor х que deja 60% del área a la izquierda, como 
se muestra en la figura 6.21. En la tabla A.3 encontramos que P(Z < 0.25) = 0.6, de 
manera que el valor z deseado es 0.25. Ahora, x = (7) (0.25) + 74 = 75.75. Por lo tanto, 
р. = 75.75. Es decir, 60% de las calificaciones son 75 o menos. И | 


Ejercicios 


6.1 Dada una distribución continua uniforme, de- 


muestre que 
A+B 


a) p= 2 >y 


2 _ (B-A)? 
р) 0 =>. 


6.2 Suponga que X tiene una distribución continua 
uniforme de 1 a 5. Determine la probabilidad condicio- 
nal P(X > 2.5 |X <4. 


6.3 La cantidad de café diaria, en litros, que sirve 
una máquina que se localiza en el vestíbulo de un 
aeropuerto es una variable aleatoria X que tiene una 


distribución continua uniforme соп А = 7 y B = 10. 
Calcule la probabilidad de que en un día determina- 
do la cantidad de café que sirve esta máquina sea 


a) alo sumo 8.8 litros; 

b) más de 7.4 litros, pero menos de 9.5 litros; 

c) al menos 8.5 litros. 
6.4 Un autobús llega cada 10 minutos a una parada. 
Se supone que el tiempo de espera para un individuo en 


particular es una variable aleatoria con distribución 
continua uniforme. 
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a) ¿Cuál es la probabilidad de que el individuo espe- 
re más de 7 minutos? 

b) ¿Cuál es la probabilidad de que el individuo espe- 
re entre 2 y 7 minutos? 


6.5 Dada una distribución normal estándar, calcule el 
área bajo la curva que está 

a) ala izquierda de z = —1.39; 

b) ala derecha de z = 1.96; 

с) entre z =-2.16 y z =-—0.65; 

d) ala izquierda de z = 1.43; 

e) ala derecha de z = -0.89; 

f) entre z =-0.48 y z = 1.74. 


6.6 Calcule el valor de z si el área bajo una curva nor- 
mal estándar 

a) ala derecha de z es 0.3622; 

b) ala izquierda de z es 0.1131; 

c) entre Оу z, con z > 0, es 0.4838; 

d) entre -z y z, con z > 0, es 0.9500. 


6.7 Dada una distribución normal estándar, calcule el 
valor de k tal que 
a) P(Z > k) = 0.2946; 
b) P(Z < k) = 0.0427; 
c) P(-0.93 < Z < k) = 0.7235. 
6.8 Dada una distribución normal con и = 30 y o = 6, 
calcule 
a) el área de la curva normal a la derecha de x = 17; 
b) el área de la curva normal a la izquierda de x = 22; 
c) el área de la curva normal entre x = 32 y x = 41; 
d) el valor de x que tiene 80% del área de la curva 
normal a la izquierda; 
e) los dos valores de x que contienen 75% central del 
área de la curva normal. 


6.9 Dada la variable X normalmente distribuida con 
una media de 18 y una desviación estándar de 2.5, 
calcule 

a) P(X < 15); 

b) el valor de k tal que P(X < k) = 0.2236; 

c) el valor de k tal que P(X > k) = 0.1814; 

а) PAT7<X<21). 


6.10 De acuerdo con el teorema de Chebyshev, la 
probabilidad de que cualquier variable aleatoria tome 
un valor dentro de 3 desviaciones estándar de la media 
es de al menos 8/9. Si se sabe que la distribución de 
probabilidad de una variable aleatoria X es normal con 
media u y varianza o°, ¿cuál es el valor exacto de 
P(u -30 < X < u + 30)? 


6.11 Una máquina expendedora de bebidas gaseosas 
se regula para que sirva un promedio de 200 mililitros 
por vaso. Si la cantidad de bebida se distribuye nor- 
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malmente con una desviación estándar igual a 15 mi- 
lilitros, 

a) ¿qué fracción de los vasos contendrá más de 224 
mililitros? 

b) ¿cuál es la probabilidad de que un vaso contenga 
entre 191 y 209 mililitros? 

c) ¿cuántos vasos probablemente se derramarán si se 
utilizan vasos de 230 mililitros para las siguientes 
1000 bebidas? 

d) ¿por debajo de qué valor obtendremos el 25% más 
bajo en el llenado de las bebidas? 


6.12 Las barras de pan de centeno que cierta panade- 
ría distribuye a las tiendas locales tienen una longitud 
promedio de 30 centímetros y una desviación estándar 
de 2 centímetros. Si se supone que las longitudes están 
distribuidas normalmente, ¿qué porcentaje de las ba- 
rras son 

a) más largas que 31.7 centímetros? 

b) de entre 29.3 y 33.5 centímetros de longitud? 

c) más cortas que 25.5 centímetros? 


6.13 Un investigador informa que unos ratones a los 
que primero se les restringen drásticamente sus dietas y 
después se les enriquecen con vitaminas y proteínas vi- 
virán un promedio de 40 meses. Si suponemos que la 
vida de tales ratones se distribuye normalmente, con 
una desviación estándar de 6.3 meses, calcule la proba- 
bilidad de que un ratón determinado viva 

a) más de 32 meses; 

b) menos de 28 meses; 

c) entre 37 y 49 meses. 


6.14 El diámetro interior del anillo de un pistón ter- 
minado se distribuye normalmente con una media de 
10 centímetros y una desviación estándar de 0.03 cen- 
tímetros. 

a) ¿Qué proporción de anillos tendrá diámetros inte- 
riores que excedan 10.075 centímetros? 

b) ¿Cuál es la probabilidad de que el anillo de un pis- 
tón tenga un diámetro interior de entre 9.97 y 
10.03 centímetros? 

c) ¿Por debajo de qué valor del diámetro interior cae- 
rá el 15% de los anillos de pistón? 


6.15 Un abogado viaja todos los días de su casa en 
los suburbios a su oficina en el centro de la ciudad. El 
tiempo promedio para un viaje sólo de ida es de 24 mi- 
nutos, con una desviación estándar de 3.8 minutos. Si 
se supone que la distribución de los tiempos de viaje 
está distribuida normalmente. 
a) ¿Cuál es la probabilidad de que un viaje tome al 
menos 1/2 hora? 
b) Si la oficina abre a las 9:00 А.м. y él sale diario de 
su casa a las 8:45 A.M., ¿qué porcentaje de las ve- 
ces llegará tarde al trabajo? 
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c) Si sale de su casa a las 8:35 A.M. y el café se sirve en 
la oficina de 8:50 a.m. a 9:00 A.M., ¿cuál es la pro- 
babilidad de que se pierda el café? 

d) Calcule la duración mayor en la que se encuentra 
el 15% de los viajes más lentos. 

e) Calcule la probabilidad de que 2 de los siguientes 
3 viajes tomen al menos 1/2 hora. 


6.16 En el ejemplar de noviembre de 1990 de Chemi- 
cal Engineering Progress, un estudio analiza el porcen- 
taje de pureza del oxígeno de cierto proveedor. Suponga 
que la media fue de 99.61, con una desviación estándar 
de 0.08. Suponga que la distribución del porcentaje de 
pureza fue aproximadamente normal. 
a) ¿Qué porcentaje de los valores de pureza esperaría 
que estuvieran entre 99.5 y 99.7? 
b) ¿Qué valor de pureza esperaría que excediera 
exactamente 5% de la población? 


6.17 La vida promedio de cierto tipo de motor pe- 
queño es de 10 años, con una desviación estándar de 
2 años. El fabricante reemplaza gratis todos los moto- 
res que fallen dentro del periodo de garantía. Si estu- 
viera dispuesto a reemplazar sólo 3% de los motores 
que fallan, ¿cuánto tiempo de garantía debería ofrecer? 
Suponga que la duración de un motor sigue una distri- 
bución normal. 


6.18 La estatura de 1000 estudiantes se distribuye 
normalmente con una media de 174.5 centímetros y 
una desviación estándar de 6.9 centímetros. Si se supo- 
ne que las estaturas se redondean al medio centímetro 
más cercano, ¿cuántos de estos estudiantes esperaría 
que tuvieran una estatura 

a) menor que 160.0 centímetros? 

b) de entre 171.5 y 182.0 centímetros inclusive? 

c) igual a 175.0 centímetros? 

d) mayor o igual que 188.0 centímetros? 


6.19 Una empresa paga a sus empleados un salario 
promedio de $15.90 por hora, con una desviación es- 
tándar de $1.50. Si los salarios se distribuyen aproxi- 
madamente de forma normal y se redondean al centavo 
más cercano, 
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a) ¿qué porcentaje de los trabajadores recibe salarios 
de entre $13.75 y $16.22 por hora? 

b) ¿el 5% de los salarios más altos por hora de los 
empleados es mayor a qué cantidad? 


6.20 Los pesos de un gran número de poodle miniatura 
se distribuyen aproximadamente de forma normal con 
una media de 8 kilogramos y una desviación están- 
dar de 0.9 kilogramos. Si las mediciones se redondean 
al décimo de kilogramo más cercano, calcule la frac- 
ción de estos poodle con pesos 

a) por arriba de 9.5 kilogramos; 

b) alo sumo 8.6 kilogramos; 

c) entre 7.3 y 9.1 kilogramos. 


6.21 La resistencia a la tensión de cierto componente 
de metal se distribuye normalmente con una media de 
10,000 kilogramos por centímetro cuadrado y una des- 
viación estándar de 100 kilogramos por centímetro 
cuadrado. Las mediciones se redondean a los 50 kilo- 
gramos por centímetro cuadrado más cercanos. 

a) ¿Qué proporción de estos componentes excede a 
10,150 kilogramos por centímetro cuadrado de re- 
sistencia a la tensión? 

b) Si las especificaciones requieren que todos los 
componentes tengan una resistencia a la tensión 
de entre 9800 y 10,200 kilogramos por centímetro 
cuadrado, ¿qué proporción de piezas esperaría que 
se descartara? 


6.22 Si un conjunto de observaciones se distribuye de 
manera normal, ¿qué porcentaje de éstas difieren de la 
media en 

a) más de 1.30? 

b) menos de 0.520? 


6.23 El coeficiente intelectual (СТ) de 600 aspirantes 
a cierta universidad se distribuye aproximadamente de 
forma normal con una media de 115 y una desviación 
estándar de 12. Si la universidad requiere un CI de al 
menos 95, ¿cuántos de estos estudiantes serán rechaza- 
dos con base en éste sin importar sus otras calificacio- 
nes? Tome en cuenta que el CI de los aspirantes se 
redondea al entero más cercano. 


6.5 Aproximación normal a la binomial 


Las probabilidades asociadas con experimentos binomiales se obtienen fácilmente a 
partir de la fórmula b(x; n, p) de la distribución binomial o de la tabla A.1 cuando л es 
pequeña. Además, las probabilidades binomiales están disponibles en muchos paquetes 
de software. Sin embargo, resulta aleccionador conocer la relación entre la distribución 
binomial y la normal. En la sección 5.5 explicamos cómo se puede utilizar la distribu- 
ción de Poisson para aproximar probabilidades binomiales cuando n es muy grande y 
р se acerca mucho a 0 о a 1. Tanto la distribución binomial como la de Poisson son 
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Teorema 6.3: 
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discretas. La primera aplicación de una distribución continua de probabilidad para 
aproximar probabilidades sobre un espacio muestral discreto se demostró en el ejem- 
plo 6.12, donde se utilizó la curva normal. La distribución normal a menudo es una 
buena aproximación a una distribución discreta cuando la última adquiere una forma de 
campana simétrica. Desde un punto de vista teórico, algunas distribuciones convergen 
a la normal a medida que sus parámetros se aproximan a ciertos límites. La distribución 
normal es una distribución de aproximación conveniente, ya que la función de distribu- 
ción acumulativa se tabula con mucha facilidad. La distribución binomial se aproxima 
bien por medio de la normal en problemas prácticos cuando se trabaja con la función de 
distribución acumulativa. Ahora plantearemos un teorema que nos permitirá utilizar 
áreas bajo la curva normal para aproximar propiedades binomiales cuando n es sufi- 
cientemente grande. 


Si X es una variable aleatoria binomial con media u = np y varianza 0? = npq, enton- 
ces la forma limitante de la distribución de 


X —np 
уа ` 


conforme n — оо, es la distribución normal estándar n(z; 0, 1). 


2 == 


Resulta que la distribución normal con 4 = np y 0? = пр(1 — р) no sólo ofrece una 
aproximación muy precisa a la distribución binomial cuando n es grande y p no está 
extremadamente cerca de 0 o de І, sino que también brinda una aproximación bastante 
buena aun cuando n es pequeña y p está razonablemente cerca de 1/2. 

Para ilustrar la aproximación normal a la distribución binomial primero dibujamos 
el histograma para b(x; 15, 0.4) y después superponemos la curva normal particular con 
la misma media y varianza que la variable binomial X. En consecuencia, dibujamos una 
curva normal con 


и = пр = (150.4) =6 y о? = пра = (15)(0.4)(0.6) = 3.6. 


El histograma de b(x; 15, 0.4) y la curva normal superpuesta correspondiente, que está 
determinada por completo por su media y su varianza, se ilustran en la figura 6.22. 


Г | [N 
== AAA a ———Ó 
01234567809 11 13 15 


Figura 6.22: Aproximación normal de р(х; 15, 0.4). 
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La probabilidad exacta de que la variable aleatoria binomial X tome un valor deter- 
minado x es igual al área de la barra cuya base se centra en x. Por ejemplo, la probabili- 
dad exacta de que X tome el valor 4 es igual al área del rectángulo con base centrada en 
x = 4. Si usamos la tabla А.І, encontramos que esta área es 


Р(Х = 4) = b(4;15, 0.4) = 0.1268, 


que es aproximadamente igual al área de la región sombreada bajo la curva normal entre 
las dos ordenadas x, = 3.5 y x, = 4.5 en la figura 6.23. Al convertir a valores z, tenemos 


35=6 4.5—6 
Ср у == 
= 1897 2 у 2= 897 


= —0.79. 


01234566789 11 13 15 


9 
Figura 6.23: Aproximación normal de Р(х; 15, 0.4) у У? р(х; 15, 0.4). 
х=7 


Si X es una variable aleatoria binomial у Z una variable normal estándar, entonces, 


Р(Х = 4) = b(4;15,0.4) =P (-1.32 < Z < -0.79) 
= P (Z < —0.79) — Р (Z < —1.32) = 0.2148 — 0.0934 = 0.1214. 


Esto se aproxima bastante al valor exacto de 0.1268. 

La aproximación normal es más útil en el cálculo de sumatorias binomiales para 
valores grandes de n. Si nos remitimos a la figura 6.23, nos podríamos interesar en la 
probabilidad de que X tome un valor de 7 a 9. La probabilidad exacta es dada por 


9 6 
Р(7=Х <9) = УЬ; 15,0.4) — У bx; 15,0.4) 
х=0 х=0 
= 0.9662 — 0.6098 = 0.3564, 


que es igual а la sumatoria de las áreas de los rectángulos cuyas bases están centradas еп 
x = 7, 8 y 9. Para la aproximación normal calculamos el área de la región sombreada 
bajo la curva entre las ordenadas x, = 6.5 y x, = 9.5 de la figura 6.23. Los valores z co- 
rrespondientes son 


6.5—6 956 


21 = 
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Ahora, 


Р(7<Х <9) =P(0.26<Z < 1.85) = Р(Х < 1.85) — Р(Х < 0.26) 
= 0.9678 — 0.6026 = 0.3652. 


Una vez más, la aproximación de la curva normal ofrece un valor que se acerca al 
valor exacto de 0.3564. El grado de exactitud, que depende de qué tan bien se ajuste la 
curva al histograma, se incrementa a medida que aumenta п. Esto es particularmente cierto 
cuando p no está muy cerca de 1/2 y el histograma ya no es simétrico. Las figuras 6.24 y 
6.25 muestran los histogramas para b(x; 6, 0.2) y b(x; 15, 0.2), respectivamente. Es eviden- 
te que una curva normal se ajustará mucho mejor al histograma cuando n = 15 que cuando 


п = 6. 
Laaa dl dd 2 у 
0 1 2 3 4 5 6 01234567809 11 13 15 
Figura 6.24: Histograma para b(x; 6, 0.2). Figura 6.25: Histograma para b(x; 15, 0.2). 


En las ilustraciones de la aproximación normal a la binomial se hizo evidente que si 
buscamos el área bajo la curva normal hacia la izquierda de, digamos x, es más preciso 
utilizar x + 0.5. Esto es una corrección para dar cabida al hecho de que una distribución 
discreta se aproxima mediante una distribución continua. La corrección +0.5 se llama 
corrección de continuidad. La explicación anterior conduce a la siguiente aproxima- 
ción normal formal a la binomial. 


Aproximación Sea X una variable aleatoria binomial con parámetros n y p. Para una n grande, X tiene 
normal a la aproximadamente una distribución normal con 4 = np y 0? = прӯ = np(l — p) y 
distribución x 
binomial P(X <x) = 5 b(k;n, p) 
k=0 


= área bajo la curva normal a la izquierda de x + 0.5 


(2 = E) 


"Pa 


Ш 


y la aproximación será buena si np y п(1 — р) son mayores que o iguales a 5. 


Como indicamos antes, la calidad de la aproximación es muy buena para n grande. 
Si p está cerca de 1/2, un tamaño de la muestra moderado o pequeño será suficiente para 
una aproximación razonable. Ofrecemos la tabla 6.1 como una indicación de la calidad 
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de la aproximación. Se presentan tanto la aproximación normal como las probabilidades 
binomiales acumulativas reales. Observe que en p = 0.05 y p = 0.10 la aproximación es 
muy burda para n = 10. Sin embargo, incluso para n = 10, observe la mejoría para 
p = 0.50. Por otro lado, cuando p es fija en p = 0.05, observe cómo mejora la aproxima- 
ción conforme vamos de n = 20 a n = 100. 


Tabla 6.1: Aproximación normal y probabilidades binomiales acumulativas reales 
p = 0.05, п = 10 р = 0.10,п = 10 р = 0.50,п = 10 


r Binomial Normal Binomial Normal Binomial Normal 
0 0.5987 0.5000 0.3487 0.2981 0.0010 0.0022 
1 0.9139 0.9265 0.7361 0.7019 0.0107 0.0136 
2 0.9885 0.9981 0.9298 0.9429 0.0547 0.0571 
© 0.9990 1.0000 0.9872 0.9959 0.1719 0.1711 
4 1.0000 1.0000 0.9984 0.9999 0.3770 0.3745 
5 1.0000 1.0000 0.6230 0.6255 
6 0.8281 0.8289 
7 0.9453 0.9429 
8 0.9893 0.9864 
9 0.9990 0.9978 
10 1.0000 0.9997 
р = 0.05 
n=20 n=50 п = 100 


r Binomial Normal Binomial Normal Binomial Normal 
0 0.3585 0.3015 0.0769 0.0968 0.0059 0.0197 
1 0.7358 0.6985 0.2794 0.2578 0.0371 0.0537 
2 0.9245 0.9382 0.5405 0.5000 0.1183 0.1251 
3 0.9841 0.9948 0.7604 0.7422 0.2578 0.2451 
4 0.9974 0.9998 0.8964 0.9032 0.4360 0.4090 
5 0.9997 1.0000 0.9622 0.9744 0.6160 0.5910 
6 1.0000 1.0000 0.9882 0.9953 0.7660 0.7549 
7 0.9968 0.9994 0.8720 0.8749 
8 0.9992 0.9999 0.9369 0.9463 
9 0.9998 1.0000 0.9718 0.9803 
0 1.0000 1.0000 0.9885 0.9941 


Ejemplo 6.15: Un paciente que padece una rara enfermedad de la sangre tiene 0.4 de probabilidad de 


Solución: 


recuperarse. Si se sabe que 100 personas contrajeron esta enfermedad, ¿cuál es la proba- 
bilidad de que sobrevivan menos de 30? 

Representemos con la variable binomial X el número de pacientes que sobreviven. Como 
n = 100, deberíamos obtener resultados muy precisos usando la aproximación de la 
curva normal con 


H = пр = (100)(0.4) = 40 y o= 4 /прд = y (100)(0.4)(0.6)= 4.899. 


Para obtener la probabilidad que se desea, tenemos que calcular el área a la izquier- 
da de x = 29.5. 
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El valor z que corresponde a 29.5 es 


29.5 — 40 
= = ГТ 
© = 1.899 


y la probabilidad de que menos de 30 de los 100 pacientes sobrevivan está dada por la 
región sombreada en la figura 6.26. Por lo tanto, 


Р(Х < 30) = P(Z <-2.14) = 0.0162. 3 


—2.14 0 0 1.16 2.71 


Figura 6.26: Área para el ejemplo 6.15. Figura 6.27: Área para el ejemplo 6.16. 


Ejemplo 6.16: | Un examen de opción múltiple tiene 200 preguntas, cada una con 4 respuestas posibles, 
de las que sólo una es la correcta. ¿Cuál es la probabilidad de que solamente adivinando 
se obtengan de 25 a 30 respuestas correctas para 80 de los 200 problemas sobre los que 
el estudiante no tiene conocimientos? 

Solución: La probabilidad de adivinar una respuesta correcta para cada una de las 80 preguntas es 
р = 1/4. Si X representa el número de respuestas correctas sólo porque se adivinaron, 
entonces, 30 


P(25 < X < 30) = У b(x;80, 1/4). 
x=25 


Al usar la aproximación de la curva normal con 


u = пр =(80) (5) = 20 


с = [пра = yV (80)(1 /4)(3 /4) = 3.873, 
necesitamos el área entre х, = 24.5 у х, = 30.5. Los valores z correspondientes son 


2520 ije, 30.520 
5 ЕЭО ааа 


3.873 
La probabilidad de adivinar correctamente de 25 а 30 preguntas es dada por la región 
sombreada de la figura 6.27. En la tabla A.3 encontramos que 
30 
Р(25 <Х <30) = 5 Ь(х;80, 0.25) = P(1.16 < Z < 2.71) 
x=25 
=P(Z < 2.71) Р(Х < 1.16) = 0.9966 — 0.8770 = 0.1196. И | 


= 2.71. 


Ejercicios 


Ejercicios 


6.24 Se lanza una moneda 400 veces. Utilice la 
aproximación a la curva normal para calcular la proba- 
bilidad de obtener 

a) entre 185 y 210 caras; 

b) exactamente 205 caras; 

с) menos de 176 o más de 227 caras. 


6.25 En un proceso para fabricar un componente 
electrónico, 1% de los artículos resultan defectuosos. 
Un plan de control de calidad consiste en seleccionar 
100 artículos de un proceso de producción y detenerlo 
о continuar con él si ninguno está defectuoso. Use la 
aproximación normal a la binomial para calcular 
a) la probabilidad de que el proceso continúe con el 
plan de muestreo descrito; 
b) la probabilidad de que el proceso continúe aun si 
éste va mal (es decir, si la frecuencia de componen- 
tes defectuosos cambió a 5.0% de defectuosos). 


6.26 Un proceso produce 10% de artículos defectuo- 
sos. Si se seleccionan al azar 100 artículos del proce- 
so, ¿cuál es la probabilidad de que el número de 
defectuosos 

a) exceda los 13? 

b) sea menor que 8? 


6.27 Un paciente tiene 0.9 de probabilidad de recupe- 
rarse de una operación de corazón delicada. De los si- 
guientes 100 pacientes que se someten a esta operación, 
¿cuál es la probabilidad de que 

a) sobrevivan entre 84 y 95 inclusive? 

b) sobrevivan menos de 86? 


6.28 Investigadores de la Universidad George Wa- 
shington y del Instituto Nacional de Salud informan 
que aproximadamente 75% de las personas cree que 
“los tranquilizantes funcionan muy bien para lograr 
que una persona esté más tranquila y relajada”. De las 
siguientes 80 personas entrevistadas, ¿cuál es la proba- 
bilidad de que 

a) al menos 50 tengan esta opinión? 

b) alo sumo 56 tengan esta opinión? 


6.29 51 20% de los residentes de una ciudad de Esta- 
dos Unidos prefieren un teléfono blanco sobre cual- 
quier otro color disponible, ¿cuál es la probabilidad de 
que, de los siguientes 1000 teléfonos que se instalen en 
esa ciudad, 

а) entre 170 y 185 sean blancos? 

b) al menos 210 pero no más de 225 sean blancos? 


6.30 Un fabricante de medicamentos sostiene que 
cierto medicamento cura una enfermedad de la sangre, 
en promedio, 80% de las veces. Para verificar la aseve- 
ración, inspectores gubernamentales utilizan el medi- 
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camento en una muestra de 100 individuos y deciden 
aceptar la afirmación si se curan 75 o más. 

a) ¿Cuál es la probabilidad de que los inspectores gu- 
bernamentales rechacen la aseveración si la proba- 
bilidad de curación es, de hecho, de 0.8? 

b) ¿Cuál es la probabilidad de que el gobierno acepte 
la afirmación si la probabilidad de curación resulta 
tan baja como 0.7? 


6.31 Una sexta parte de los estudiantes de primer año 
que entran a una escuela estatal grande provienen de 
otros estados. Si son asignados al azar a los 180 dormi- 
torios de un edificio, ¿cuál es la probabilidad de que en 
un determinado dormitorio al menos una quinta parte 
de los estudiantes provenga de otro estado? 


6.32 Una empresa farmacéutica sabe que aproxima- 
damente 5% de sus píldoras anticonceptivas no contiene 
la cantidad suficiente de un ingrediente, lo que las vuel- 
ve ineficaces. ¿Cuál es la probabilidad de que menos de 
10 píldoras en una muestra de 200 sean ineficaces? 


6.33 Estadísticas publicadas рог la National Highway 
Traffic Safety Administration y el National Safety 
Council revelan que en una noche promedio de fin de 
semana, uno de cada 10 conductores está ebrio. Si la 
siguiente noche de sábado se revisan 400 conductores 
al azar, ¿cuál es la probabilidad de que el número de 
conductores ebrios sea 

a) menor que 32? 

b) mayor que 49? 

с) al menos 35 pero menos que 47? 


6.34 Un par de dados se lanza 180 veces. ¿Cuál es la 
probabilidad de que ocurra un total de 7 

a) al menos 25 veces? 

b) entre 33 y 41 veces? 

с) exactamente 30 veces? 


6.35 Una empresa produce partes componentes para 
un motor. Las especificaciones de las partes sugieren 
que sólo 95% de los artículos las cumplen. Las partes 
para los clientes se embarcan en lotes de 100. 
a) ¿Cuál es la probabilidad de que más de 2 artícu- 
los estén defectuosos en un lote determinado? 
b) ¿Cuál es la probabilidad de que más de 10 artícu- 
los de un lote estén defectuosos? 


6.36 Una práctica común por parte de las aerolíneas 
consiste en vender más boletos que el número real de 
asientos para un vuelo específico porque los clientes 
que compran boletos no siempre se presentan a abordar 
el avión. Suponga que el porcentaje de pasajeros que 
no se presentan a la hora del vuelo es de 2%. Para un 
vuelo particular con 197 asientos, se vendieron un total 
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de 200 boletos. ¿Cuál es la probabilidad de que la aero- 
línea haya sobrevendido el vuelo? 


6.37 El nivel X de colesterol en la sangre en mucha- 
chos de 14 años tiene aproximadamente una distribu- 
ción normal, con una media de 170 y una desviación 
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6.38 Una empresa de telemarketing tiene una máqui- 
na especial para abrir cartas que abre y extrae el conte- 
nido de los sobres. Si un sobre se colocara de forma 
incorrecta en la máquina, no se podría extraer su conte- 
nido, o incluso se podría dañar. En este caso se dice que 


estándar de 30. 


a) Determine la probabilidad de que el nivel de coles- 
terol en la sangre de un muchacho de 14 años ele- 
gido al azar exceda 230. 

b) En una escuela secundaria hay 300 muchachos de 
14 años. Determine la probabilidad de que por lo 
menos 8 de ellos tengan un nivel de colesterol su- 


perior a 230. 


“falló” la máquina. 

a) Si la probabilidad de que falle la máquina es de 
0.01, ¿cuál es la probabilidad de que ocurra más 
de una falla en un lote de 20 sobres? 

b) Si la probabilidad de que falle la máquina es de 
0.01 y se abrirá un lote de 500 sobres, ¿cuál es la 
probabilidad de que ocurran más de 8 fallas? 


6.6 Distribución gamma y distribución exponencial 


Definición 6.2: 


Aunque la distribución normal se puede utilizar para resolver muchos problemas de in- 
geniería y ciencias, aún hay numerosas situaciones que requieren diferentes tipos de 
funciones de densidad. En esta sección se estudiarán dos de estas funciones de densidad, 
la distribución gamma y la distribución exponencial. 

Resulta que la distribución exponencial es un caso especial de la distribución gamma, 
y ambas tienen un gran número de aplicaciones. La distribución exponencial y la distri- 
bución gamma desempeñan un papel importante en la teoría de colas y en problemas de 
confiabilidad. Los tiempos entre llegadas en instalaciones de servicio y los tiempos de ope- 
ración antes de que partes componentes y sistemas eléctricos empiecen a fallar a menudo 
se representan bien mediante la distribución exponencial. La relación entre la distribu- 
ción gamma y la exponencial permite que la gamma se utilice en problemas similares. 
En la siguiente sección se presentarán más detalles y ejemplos. 

La distribución gamma deriva su nombre de la bien conocida función gamma, que 
se estudia en muchas áreas de las matemáticas. Antes de estudiar la distribución gamma 
repasaremos esta función y algunas de sus propiedades importantes. 


La función gamma se define como 


го) = | бош и ах para а > 0 
0 


Las siguientes son algunas propiedades sencillas de la función gamma. 
a) Mn) = (n- 1)(п— 2). (1) Г (1) para una integral positiva n. 


Para ver la demostración, al integrar por partes сопи = х! y dv = e7* dx, obtenemos 
* сю оо 
оо а > 
Tr(a) = –е7* х! |, + | e™ (a — 1) dx = (a — р | a ду, 
0 0 


para а > 1, que produce la fórmula recursiva 
Ta) = (а – 1)Г(о — 1). 


El resultado proviene de la aplicación repetida de la fórmula recursiva. Si utilizamos este 
resultado, podemos demostrar con facilidad las siguientes dos propiedades. 
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b) T(n) = (n — 1)! para una integral positiva n. 
с) Г(1)= 1. 


Asimismo, tenemos la siguiente propiedad de T (œ), que el lector deberá verificar (véase 
el ejercicio 6.39 de la página 206). 


d) T(1/2) = yr. 


A continuación se define la distribución gamma. 


Distribución La variable aleatoria continua X tiene una distribución gamma, con parámetros Q y f, 
gamma si su función de densidad está dada por 


1 =] -x 
сеа 8) = ш а. x>0, 


0, en otro caso, 


donde а > 0y В > 0. 


En la figura 6.28 se muestran gráficas de varias distribuciones gamma рага ciertos 
valores específicos de los parámetros о y 8. La distribución gamma especial para la que 
Q = 1 se llama distribución exponencial. 


f(x) 


1.0 


De 
О! 


0.5 


Е! 
= № 


oe 


Figura 6.28: Distribuciones gamma. 


Distribución La variable aleatoria continua X tiene una distribución exponencial, con parámetro [, 
exponencial si su función de densidad es dada por 


12-х/ В 
розв) = 0267 7 20 
0, en otro caso, 


donde В > 0. 
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El siguiente teorema y corolario proporcionan la media y la varianza de la distribución 
gamma y la exponencial. 


Teorema 6.4: La media y la varianza de la distribución gamma son 


MEL A 


La demostración de este teorema se encuentra en el apéndice A.26. 


Corolario 6.1: La media y la varianza de la distribución exponencial son 


ш=@у@ =p 


Relación con el proceso de Poisson 


Continuaremos con las aplicaciones de la distribución exponencial y después regresare- 
mos a la distribución gamma. Las aplicaciones más importantes de la distribución expo- 
nencial son situaciones donde se aplica el proceso de Poisson (véase la sección 5.5). El 
lector debería recordar que el proceso de Poisson permite utilizar la distribución discreta 
llamada distribución de Poisson. Recuerde que la distribución de Poisson se utiliza para 
calcular la probabilidad de números específicos de “eventos” durante un periodo o espa- 
cio particulares. En muchas aplicaciones la variable aleatoria es el tiempo o la cantidad 
de espacio. Por ejemplo, un ingeniero industrial se podría interesar en un modelo de 
tiempo Т entre las llegadas en una intersección congestionada durante las horas de ma- 
yor afluencia en una ciudad grande. Una llegada representa el evento de Poisson. 

La relación entre la distribución exponencial (a menudo denominada exponencial 
negativa) y el proceso de Poisson es muy simple. En el capítulo 5 la distribución de 
Poisson se desarrolló como una distribución de un solo parámetro con parámetro A, 
donde А se interpreta como el número medio de eventos por unidad de “tiempo”. Con- 
sidere ahora la variable aleatoria descrita por el tiempo que se requiere para que ocurra 
el primer evento. Si utilizamos la distribución de Poisson, vemos que la probabilidad de 
que no ocurra algún evento, en el periodo hasta el tiempo г, es dada por 


етм)? _ e 


p(0; №) = 0! 


Ahora podemos utilizar lo anterior y hacer que X sea el tiempo para el primer evento de 
Poisson. La probabilidad de que la duración del tiempo hasta el primer evento exceda x 
es la misma que la probabilidad de que no ocurra algún evento de Poisson en x. Esto 
último, por supuesto, es dado por e™™. Como resultado, 


Р(Х > х) = е^. 
Así, la función de distribución acumulativa рага X es dada por 
PO<X <x)=1-e*, 


Ahora, para poder reconocer la presencia de la distribución exponencial, podemos dife- 
renciar la función de distribución acumulativa anterior con el fin de obtener la función de 
densidad 
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SQA, 


que es la función de densidad de la distribución exponencial con А = 1/8. 


Aplicaciones de la distribución exponencial y la distribución gamma 


En la explicación anterior establecimos las bases para la aplicación de la distribución 
exponencial en el “tiempo de llegada” o tiempo para problemas con eventos de Poisson. 
Aquí ilustraremos algunas aplicaciones de modelado y después procederemos a analizar 
el papel que la distribución gamma desempeña en ellas. Observe que la media de la 
distribución exponencial es el parámetro 8, el recíproco del parámetro en la distribución 
de Poisson. El lector debería recordar que con frecuencia se dice que la distribución de 
Poisson no tiene memoria, lo cual implica que las ocurrencias en periodos sucesivos son 
independientes. El importante parámetro 6 es el tiempo promedio entre eventos. En la 
teoría de confiabilidad, donde la falla de equipo con frecuencia se ajusta a este proceso 
de Poisson, {3 se denomina tiempo medio entre fallas. Muchas descomposturas de equi- 
po siguen el proceso de Poisson y por ello se aplica la distribución exponencial. Otras 
aplicaciones incluyen tiempos de supervivencia en experimentos biomédicos y tiempo 
de respuesta de computadoras. 

En el siguiente ejemplo mostramos una aplicación simple de la distribución expo- 
nencial a un problema de confiabilidad. La distribución binomial también desempeña un 
papel en la solución. 


Ejemplo 6.17: | Suponga que un sistema contiene cierto tipo de componente cuyo tiempo de operación 
antes de fallar, en años, está dado por T. La variable aleatoria T se modela bien mediante 
la distribución exponencial con tiempo medio de operación antes de fallar 8 = 5. Si 
se instalan 5 de estos componentes en diferentes sistemas, ¿cuál es la probabilidad de 
que al final de 8 años al menos dos aún funcionen? 

Solución: La probabilidad de que un componente determinado siga funcionando después de 8 años 
es dada por 


P(T > 8) = 5 / е5 dt = e8 x 0.2. 
8 


Representemos con X el número de componentes que todavía funcionan después de 


8 años. Entonces, utilizando la distribución binomial tenemos 
5 1 


Р(Х >2) = Y b(x:5,0.2) =1 — Y b(x:5,0.2) =1— 0.7373 = 0.2627. 
х=2 х=0 J 


En el capítulo 3 se incluyen ejercicios y ejemplos en los que el lector ya se enfrentó 
a la distribución exponencial. Otros que implican problemas de tiempo de espera y de 
confiabilidad se pueden encontrar en el ejemplo 6.24 y en los ejercicios y ejercicios 
de repaso al final de este capítulo. 


La propiedad de falta de memoria y su efecto 
en la distribución exponencial 


En los tipos de aplicación de la distribución exponencial en los problemas de confiabili- 
dad y de tiempo de vida de una máquina o de un componente influye la propiedad de 
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falta de memoria de la distribución exponencial. Por ejemplo, en el caso de, digamos, 
un componente electrónico, en el que la distribución del tiempo de vida es exponencial, 
la probabilidad de que el componente dure, por ejemplo, t horas, es decir, Р(Х > t), es 
igual que la probabilidad condicional 


Р(Х >t0+1|X >1tp). 


Entonces, si el componente “alcanza” las г, horas, la probabilidad de que dure otras 
t horas es igual que la probabilidad de que dure t horas. No hay “castigo” a través del 
desgaste como resultado de durar las primeras 1, horas. Por lo tanto, cuando la propiedad 
de falta de memoria es justificada es más adecuada la distribución exponencial. Pero si 
la falla del componente es resultado del desgaste lento o gradual (como en el caso del 
desgaste mecánico), entonces la distribución exponencial no es aplicable y serían más 
adecuadas la distribución gamma o la de Weibull (sección 6.10). 

La importancia de la distribución gamma radica en el hecho de que define una fami- 
lia en la cual otras distribuciones son casos especiales. Pero la propia distribución gamma 
tiene aplicaciones importantes en tiempo de espera y teoría de confiabilidad. Mientras 
que la distribución exponencial describe el tiempo que transcurre hasta la ocurrencia de 
un evento de Poisson (o el tiempo entre eventos de Poisson), el tiempo (o espacio) que 
transcurre hasta que ocurre un número específico de eventos de Poisson es una variable 
aleatoria, cuya función de densidad es descrita por la distribución gamma. Este número 
específico de eventos es el parámetro о en la función de densidad gamma. De esta ma- 
nera se facilita comprender que cuando а = 1, ocurre el caso especial de la distribución 
exponencial. La densidad gamma se puede desarrollar a partir de su relación con el pro- 
ceso de Poisson de la misma manera en que lo hicimos con la densidad exponencial. Los 
detalles se dejan al lector. El siguiente es un ejemplo numérico de cómo se utiliza la 
distribución gamma en una aplicación de tiempo de espera. 


Ejemplo 6.18: | Suponga que las llamadas telefónicas que llegan a un conmutador particular siguen un 


proceso de Poisson con un promedio de 5 llamadas entrantes por minuto. ¿Cuál es la 
probabilidad de que transcurra hasta un minuto en el momento en que han entrado 2 
llamadas al conmutador? 


Solución: Se aplica el proceso de Poisson, con un lapso de tiempo hasta que ocurren 2 eventos de 


Poisson que sigue una distribución gamma con 8 = 1/5 уа = 2. Denote con X el tiem- 
po en minutos que transcurre antes de que lleguen 2 llamadas. La probabilidad que se 
requiere está dada por 
1 1 
1 —х/ В —5х —5 
Р(Х<1) = qxe HP dx = 25 хе ?* dx =1-e ?(1 +5) = 0.96. 
o 8 0 

Mientras el origen de la distribución gamma trata con el tiempo (o espacio) hasta la 
ocurrencia de о eventos de Poisson, hay muchos ejemplos donde una distribución gamma 
funciona muy bien aunque no exista una estructura de Poisson clara. Esto es particu- 
larmente cierto para problemas de tiempo de supervivencia en aplicaciones de ingenie- 
ría y biomédicas. 


Ejemplo 6.19: | En un estudio biomédico con ratas se utiliza una investigación de respuesta a la dosis para 


determinar el efecto de la dosis de un tóxico en su tiempo de supervivencia. El tóxico es 
producido por el combustible que utilizan los aviones y, en consecuencia, descargan con 
frecuencia a la atmósfera. Para cierta dosis del tóxico, el estudio determina que el tiempo 
de supervivencia de las ratas, en semanas, tiene una distribución gamma con а = 5 y 8 = 10. 
¿Cuál es la probabilidad de que una rata no sobreviva más de 60 semanas? 
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Solución: 


Sea la variable aleatoria X el tiempo de supervivencia (tiempo hasta la muerte). La pro- 
babilidad que se requiere es 
1 50 xole 8 
P(X <60) = f dx. 
8° Jo r5) 
La integral anterior se puede resolver mediante la función gamma incompleta, que se 
convierte en la función de distribución acumulativa para la distribución gamma. Esta 


función se escribe como 
х ,Q=1l_,-y 
en) 
Ко) = | 2 Б 
0 


Г(а) 


Si permitimos que у = х/ 68, de modo que х = By, tenemos 
6 у%е—У 

Р(Х < 60) = ——— dy, 

( ) / гу Ë 


que se denota como F(6; 5) en la tabla de la función gamma incompleta del apéndice 
A.23. Observe que esto permite un cálculo rápido de las probabilidades para la distribu- 
ción gamma. De hecho, para este problema la probabilidad de que la rata no sobreviva 
más de 60 días es dada por 


Р(Х < 60) = F(6;5) = 0.715. И | 


Ejemplo 6.20: | A partir de datos previos se sabe que la longitud de tiempo, en meses, entre las quejas de 


Solución: 


los clientes sobre cierto producto es una distribución gamma con @ = 2 y 3 = 4. Se 
realizaron cambios para hacer más estrictos los requerimientos del control de calidad 
después de los cuales pasaron 20 meses antes de la primera queja. ¿Parecería que los 
cambios realizados en el control de calidad resultaron eficaces? 

Sea X el tiempo para que se presente la primera queja, el cual, en las condiciones ante- 
riores а los cambios, seguía una distribución gamma con @ = 2 y 8 = 4. La pregunta se 
centra alrededor de qué tan raro es X > 20 dado que о y В permanecen con los valores 2 
y 4, repectivamente. En otras palabras, en las condiciones anteriores ¿es razonable un 
“tiempo para la queja” tan grande como 20 meses? Por consiguiente, si seguimos la so- 
lución del ejemplo 6.19, 


1 20 xele */ В 
Р(Х 220) =1- / dx. 
Ве Jo Tr(a) 


De nuevo, usando y = х/ 8 tenemos 


TO) 


donde F(5; 2) = 0.96 se obtiene de la tabla A.23. 

Como resultado, podríamos concluir que las condiciones de la distribución gamma 
con Q = 2 y 3 = 4 no son sustentadas por los datos de que un tiempo observado para la 
queja sea tan extenso como 20 meses. Entonces, es razonable concluir que el trabajo de 
control de calidad resultó eficaz. J 


52у 
Р(Х 220) =1- | Уе dy = 1— Е(5;2) = 1— 0.96 = 0.04, 
0 


Ejemplo 6.21: | Considere el ejercicio 3.31 de la página 94. Con base en abundantes pruebas se determi- 


nó que el tiempo Y en años antes de que se requiera una reparación mayor para cierta 
lavadora se caracteriza por la función de densidad 


po [i тег 


0, en otro caso. 
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Solución: 
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Observe que Y es una variable aleatoria exponencial con и = 4 años. Se considera que la 
lavadora es una ganga si no hay probabilidades de que requiera una reparación mayor 
antes de cumplir 6 años de haber sido comprada. ¿Cuál es la probabilidad de P(Y > 6)? 
¿Cuál es la probabilidad de que la lavadora requiera una reparación mayor durante el 
primer año? 


Considere la función de distribución acumulativa F(y) para la distribución exponencial, 
1 р 
Е (у) = 3], e~! Ê dt = 1-е! 8. 
В Јо 


De manera que 
P(Y >6)=1-F(6)=e*? = 0.2231. 


Por lo tanto, la probabilidad de que la lavadora requiera una reparación mayor después 
de seis años es de 0.223. Desde luego, la probabilidad de que requiera reparación antes del 
sexto año es de 0.777. Así, se podría concluir que la lavadora no es realmente una ganga. 
La probabilidad de que se requiera una reparación mayor durante el primer año es 


Р(Ү < 1) =1-е71/* = 1 – 0.779 = 0.221. 3 


6.7 Distribución chi cuadrada 


Otro caso especial muy importante de la distribución gamma se obtiene al permitir que 
а = v/2 y В = 2, donde v es un entero positivo. Este resultado se conoce como distri- 
bución chi cuadrada. La distribución tiene un solo parámetro, v, denominado grados 
de libertad. 


Distribución 
chi cuadrada 


Teorema 6.5: 


La variable aleatoria continua X tiene una distribución chi cuadrada, con v grados de 
libertad, si su función de densidad es dada por 


1 v/2-1,—x/2 
f(x;v) = 27 2т(72)Х © ‚ x>0, 
0, en otro caso, 


donde v es un entero positivo. 


La distribución chi cuadrada desempeña un papel fundamental en la inferencia esta- 
dística. Tiene una aplicación considerable tanto en la metodología como en la teoría. 
Aunque no estudiaremos con detalle sus aplicaciones en este capítulo, es importante 
tener en cuenta que los capítulos 8, 9 y 16 contienen aplicaciones importantes. La distri- 
bución chi cuadrada es un componente importante de la prueba estadística de hipótesis 
y de la estimación estadística. 

Los temas en los que se trata con distribuciones de muestreo, análisis de varianza y 
estadística no paramétrica implican el uso extenso de la distribución chi cuadrada. 


La media y la varianza de la distribución chi cuadrada son 


pp =v y а?= 2у. 
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6.8 Distribución beta 


Una extensión de la distribución uniforme es la distribución beta. Primero definiremos 
una función beta. 


Definición 6.3: Una función beta es definida por 


ЇЇ 
В (о, 8) =f хха = PA, para а, В > 0, 


donde Г(0) es la función gamma. 


Distribución La variable aleatoria continua X tiene una distribución beta con los parámetros о > 0 y 
beta В > 0, si su función de densidad es dada por 


гой = pop E 0<x <l, 
0, en otro caso. 


Observe que la distribución uniforme sobre (0, 1) es una distribución beta con los pará- 
metros &=1yß=1. 


Teorema 6.6: Га media y la varianza de una distribución beta en la que los parámetros о y 6 son 


Q a ap 
а+ В (а + В) (а +8 +1) 


respectivamente. 


Para la distribución uniforme sobre (0, 1), la media y la varianza son 


2_ (ma) 1 
(а1+12@1+1+1) 12 


respectivamente. 


6.9 Distribución logarítmica normal 


La distribución logarítmica normal se utiliza en una amplia variedad de aplicaciones. La 
distribución se aplica en casos donde una transformación logarítmica natural tiene como 
resultado una distribución normal. 


Distribución La variable aleatoria continua X tiene una distribución logarítmica normal si la varia- 
logarítmica ble aleatoria Y = In(X) tiene una distribución normal con media y y desviación estándar 
normal ø. La función de densidad de X que resulta es 


21 Ant 
1 етут)? y >O, 


Ш, O) = М?тох 
did Б х <0. 
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Figura 6.29: Distribuciones logarítmicas normales. 


Las gráficas de las distribuciones logarítmicas normales se ilustran en la figura 6.29. 


Teorema 6.7: La media y la varianza de la distribución logarítmica normal son 


u = еш+9 /2 y ос? = eBt (¿O EN 1). 


La función de distribución acumulativa es muy simple debido a su relación con la distri- 
bución normal. El uso de la función de distribución se ilustra con el siguiente ejemplo. 


Ejemplo 6.22: | $е sabe que históricamente la concentración de contaminantes producidos por plantas 
químicas exhiben un comportamiento que se parece a una distribución logarítmica nor- 
mal. Esto es importante cuando se consideran cuestiones relacionadas con el cumpli- 
miento de las regulaciones gubernamentales. Suponga que la concentración de cierto 
contaminante, en partes por millón, tiene una distribución logarítmica normal con los 
parámetros и = 3.2 y с = 1. ¿Cuál es la probabilidad de que la concentración exceda 
8 partes por millón? 

Solución: Sea la variable aleatoria X la concentración de contaminantes. Entonces 


Р(Х >8)=1-P(X < 8). 


Como In(X) tiene una distribución normal con media u = 3.2 y desviación estándar 
с = 1, 


Р(Х <8) = Ф 


Е = (1.12) = 0.1314. 


Aquí, utilizamos el símbolo Ф para denotar la función de distribución acumulativa de la 
distribución normal estándar. Como resultado, la probabilidad de que la concentración 
del contaminante exceda 8 partes por millón es 0.1314. J 
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Ejemplo 6.23: | La vida, en miles de millas, de un cierto tipo de control electrónico para locomotoras 


Solución: 


tiene una distribución aproximadamente logarítmica normal con и = 5.149 y ø = 0.737. 
Calcule el quinto percentil de la vida de un control electrónico como éste. 

A partir de la tabla A.3 sabemos que P(Z < —1.645) = 0.05. Denote como X la vida del 
control electrónico. Puesto que In(X) tiene una distribución normal con media u = 5.149 
ус = 0.737, el quinto percentil de X se calcula como 


ln(x) = 5.149 + (0.737)(—1.645) = 3.937. 


Por lo tanto, x = 51.265. Esto significa que sólo 5% de los controles tendrán un tiempo 
de vida menor que 51,265 millas. JM 


6.10 Distribución de Weibull (opcional) 


La tecnología actual permite que los ingenieros diseñen muchos sistemas complicados 
cuya operación y seguridad dependen de la confiabilidad de los diversos componentes 
que conforman los sistemas. Por ejemplo, un fusible se puede quemar, una columna de 
acero se puede torcer o un dispositivo sensor de calor puede fallar. Componentes idénticos, 
sujetos a idénticas condiciones ambientales, fallarán en momentos diferentes e imprede- 
cibles. Ya examinamos el papel que desempeñan las distribuciones gamma y exponencial 
en estos tipos de problemas. Otra distribución que se ha utilizado ampliamente en años 
recientes para tratar con tales problemas es la distribución de Weibull, introducida por 
el físico sueco Waloddi Weibull en 1939. 


Distribución de 
Weibull 


Teorema 6.8: 


La variable aleatoria continua X tiene una distribución de Weibull, con parámetros @ 
y 8, si su función de densidad es dada por 


-B 
аВхё-1ет% , x >0, 


0, en otro caso, 


f(x;a, В) = | 


donde а > 0y [В > 0. 


En la figura 6.30 se ilustran las gráficas de la distribución de Weibull para а = 1 у diver- 
sos valores del parámetro 8. Vemos que las curvas cambian de manera considerable para 
diferentes valores del parámetro В. Si permitimos que 8 = 1, la distribución de Weibull 
se reduce a la distribución exponencial. Para valores de 8 > 1 las curvas adoptan ligera- 
mente la forma de campana y se asemejan a las curvas normales, pero muestran algo de 
asimetría. 

La media y la varianza de la distribución de Weibull se establecen en el siguiente teo- 
rema. Se solicita al lector que haga la demostración en el ejercicio 6.52 de la página 206. 


La media y la varianza de la distribución de Weibull son 


с nn 


Al igual que la distribución gamma y la exponencial, la distribución de Weibull se 
aplica a problemas de confiabilidad y de prueba de vida como los de tiempo de operación 
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0 0.5 1.0 1:5 2.0 
Figura 6.30: Distribuciones de Weibull (о = 1). 


antes de la falla o la duración de la vida de un componente, que se miden desde algún 
tiempo específico hasta que falla. Representemos este tiempo de operación antes de la 
falla mediante la variable aleatoria continua Т, con función de densidad de probabilidad 
РО), donde f(t) es la distribución de Weibull. Ésta tiene la flexibilidad inherente de no 
requerir la propiedad de falta de memoria de la distribución exponencial. La función de 
distribución acumulativa (fda) para la distribución de Weibull se puede escribir en forma 
cerrada y realmente es muy útil para calcular probabilidades. 


Fda para la La función de distribución acumulativa para la distribución de Weibull es dada 
distribución por 
de Weibull в 
Е(х) = 1-е7% , para x>0, 


paraa > Оу в > 0. 


Ejemplo 6.24: ЕІ tiempo de vida Х, en horas, de un artículo en el taller mecánico tiene una distribución 
de Weibull con œ = 0.01 y 8 = 2. ¿Cuál es la probabilidad de que falle antes de 8 
horas de uso? 


Solución: P(X < 8) = Е(8) = 1-е (0.08% =] — 0.527 = 0.473. J 


La tasa de fallas para la distribución de Weibull 


Cuando se aplica la distribución de Weibull, con frecuencia es útil determinar la tasa de 
fallas (algunas veces denominada tasa de riesgo) para tener conocimiento del desgaste o 
deterioro del componente. Comencemos por definir la confiabilidad de un componente 
o producto como la probabilidad de que funcione adecuadamente por al menos un tiem- 
po específico en condiciones experimentales específicas. Por lo tanto, si R(t) se define 
como la confiabilidad del componente dado en el tiempo t, escribimos 


К() = Р(Т> t)= Pro dt =1— F(t), 
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donde F(t) es la función de distribución acumulativa de T. La probabilidad condicional 
de que un componente fallará en el intervalo de T = t a T = t + At, dado que sobrevive 
hasta el tiempo т, es 


Е( + Аг) —F(t) 
R(t) 


Al dividir esta proporción entre Aż y tomar el límite como At — 0, obtenemos la tasa 
de fallas, denotada por Z(t). De aquí, 


К@+Мм)—ЕК@ 1 Е) fO fØ 
Ar К() RO К) 1-F(0 


20= д, 


que expresa la tasa de fallas en términos de la distribución del tiempo de operación antes 
de la falla. 
Como 200) = /()/[1 – F(0], entonces la tasa de falla es dada como sigue: 


Tasa de fallas para 
la distribución 
de Weibull 


La tasa de fallas en el tiempo г para la distribución de Weibull es dada por 


Z(t) =apié=!, t >0. 


Interpretación de la tasa de fallas 


La cantidad Z(t) es bien llamada tasa de fallas porque realmente cuantifica la tasa de 
cambio con el tiempo de la probabilidad condicional de que el componente dure una Ат 
adicional dado que ha durado el tiempo t. La tasa de disminución (o crecimiento) con el 
tiempo también es importante. Los siguientes puntos son fundamentales. 


a) $18 = 1, la tasa de fallas = о, es decir, una constante. Esto, como se indicó anterior- 
mente, es el caso especial de la distribución exponencial en que predomina la falta de 
memoria. 


b) 518 > 1, Z(0) es una función creciente del tiempo 1 que indica que el componente se 
desgasta con el tiempo. 


с) 518 < 1, Z(t) es una función decreciente del tiempo t y, por lo tanto, el componente 
se fortalece o endurece con el paso del tiempo. 


Por ejemplo, el artículo en el taller mecánico del ejemplo 6.24 tiene 8 = 2 y, por 
consiguiente, se desgasta con el tiempo. De hecho, la función de la tasa de fallas es dada 
рог Z(t) = .02t. Por otro lado, suponga un parámetro donde В = 3/4 y о = 2. En ese 
caso, Z(t) = 1.5/1/* y, por lo tanto, el componente se hace más fuerte con el tiempo. 
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Ejercicios 


6.39 Utilice la función gamma con у = \/2х para de- 
mostrar que Г(1/2) = yr. 


6.40 En cierta ciudad, el consumo diario de agua (en 
millones de litros) sigue aproximadamente una distri- 
bución gamma con @ = 2 y 3 = 3. Si la capacidad 
diaria de dicha ciudad es de 9 millones de litros de 
agua, ¿cuál es la probabilidad de que en cualquier día 
dado el suministro de agua sea inadecuado? 


6.41 Si una variable aleatoria X tiene una distribución 
gamma сопа = 2 y В = 1, calcule P(1.8 < X < 2.4). 


6.42 Suponga que el tiempo, en horas, necesario para 
reparar una bomba de calor es una variable aleatoria X 
que tiene una distribución gamma con los parámetros 
в = 2 y B = 1/2. ¿Cuál es la probabilidad de que la 
siguiente llamada de servicio requiera 
a) alo sumo una hora para reparar la bomba de calor? 
b) al menos dos horas para reparar la bomba de 
calor? 


6.43 а) Calcule la media y la varianza del consumo 
diario de agua del ejercicio 6.40. 

b) De acuerdo con el teorema de Chebyshev, ¿hay 
por lo menos 3/4 de probabilidad de que el consu- 
mo de agua en cualquier día determinado caiga 
dentro de cuál intervalo? 


6.44 En cierta ciudad el consumo diario de energía 
eléctrica, en millones de kilowatts-hora, es una variable 
aleatoria X que tiene una distribución gamma con me- 
dia и = 6 y varianza 0? = 12. 
a) Calcule los valores de су . 
b) Calcule la probabilidad de que en cualquier día 
dado el consumo diario de energía exceda los 
12 millones de kilowatts-hora. 


6.45 El tiempo necesario para que un individuo sea 
atendido en una cafetería es una variable aleatoria que 
tiene una distribución exponencial con una media de 
4 minutos. ¿Cuál es la probabilidad de que una persona 
sea atendida en menos de 3 minutos en al menos 4 de 
los siguientes 6 días? 


6.46 La vida, en años, de cierto interruptor eléctrico 
tiene una distribución exponencial con una vida prome- 
dio de 8 = 2. Si 100 de estos interruptores se instalan 
en diferentes sistemas, ¿cuál es la probabilidad de que, 
a lo sumo, fallen 30 durante el primer año? 


6.47 Suponga que la vida de servicio de la batería de 
un auxiliar auditivo, en años, es una variable aleatoria 
que tiene una distribución de Weibull con а =1/2 y 


8 =2. 


Capítulo 6 Algunas distribuciones continuas de probabilidad 


a) ¿Cuánto tiempo se puede esperar que dure tal batería? 
b) ¿Cuál es la probabilidad de que tal batería esté 
funcionando después de 2 años? 


6.48 Derive la media y la varianza de la distribución beta. 


6.49 Suponga que la variable aleatoria X tiene una 
distribución beta con 4 = 1 y 8 = 3. 

a) Determine la media y la mediana de X. 

b) Determine la varianza de X. 

c) Calcule la probabilidad de que X > 1/3. 


6.50 51 la proporción de una marca de televisores que 
requiere servicio durante el primer año de operación es 
una variable aleatoria que tiene una distribución beta 
con Q = 3 y В = 2, ¿cuál es la probabilidad de que al 
menos 80% de los nuevos modelos de esta marca que 
se vendieron este año requieran servicio durante su pri- 
mer año de operación? 


6.51 Las vidas de ciertos sellos para automóvil tienen 
la distribución de Weibull con tasa de fallas Z( = 
1/ ve. Calcule la probabilidad de que tal sello aún esté 
intacto después de 4 años. 


6.52 Derive la media y la varianza de la distribución 
de Weibull. 


6.53 Еп una investigación biomédica se determinó 
que el tiempo de supervivencia, en semanas, de un ani- 
mal cuando se le somete a cierta exposición de radia- 
ción gamma tiene una distribución gamma con а = 5 у 
p=10. 

a) ¿Cuál es el tiempo medio de supervivencia de un 
animal seleccionado al azar del tipo que se utilizó 
en el experimento? 

b) ¿Cuál es la desviación estándar del tiempo de su- 
pervivencia? 

c) ¿Cuál es la probabilidad de que un animal sobrevi- 
va más de 30 semanas? 


6.54 Se sabe que la vida, en semanas, de cierto tipo 
de transistor tiene una distribución gamma con una me- 
dia de 10 semanas y una desviación estándar de \/50 
semanas. 
a) ¿Cuál es la probabilidad de que un transistor de 
este tipo dure a lo sumo 50 semanas? 
b) ¿Cuál es la probabilidad de que un transistor de 
este tipo no sobreviva las primeras 10 semanas? 


6.55 El tiempo de respuesta de una computadora es 
una aplicación importante de las distribuciones gamma 
y exponencial. Suponga que un estudio de cierto siste- 
ma de cómputo revela que el tiempo de respuesta, en 
segundos, tiene una distribución exponencial con una 
media de 3 segundos. 


Ejercicios de repaso 


a) ¿Cuál es la probabilidad de que el tiempo de res- 
puesta exceda 5 segundos? 

b) ¿Cuál es la probabilidad de que el tiempo de res- 
puesta exceda 10 segundos? 


6.56 Los datos de frecuencia a menudo tienen una 
distribución logarítmica normal. Se estudia el uso pro- 
medio de potencia (dB por hora) para una empresa es- 
pecífica y se sabe que tiene una distribución logarítmica 
normal con parámetros и = 4 у с = 2. ¿Cuál es la pro- 
babilidad de que la empresa utilice más de 270 dB du- 
rante cualquier hora particular? 


6.57 Para el ejercicio 6.56, ¿cuál es el uso de la po- 
tencia media (dB promedio por hora)? ¿Cuál es la 
varianza? 


6.58 El número de automóviles que llegan a cierta 
intersección por minuto tiene una distribución de Pois- 
son con una media de 5. Existe interés por el tiempo 
que transcurre antes de que 10 automóviles aparezcan 
en la intersección. 


Ejercicios de repaso 


6.61 Según un estudio publicado рог un grupo de so- 
ciólogos de la Universidad de Massachusetts, aproxi- 
madamente 49% de los consumidores de Valium en el 
estado de Massachusetts son empleados de oficina. 
¿Cuál es la probabilidad de que entre 482 y 510 de los 
siguientes 1000 consumidores de Valium seleccionados 
al azar de dicho estado sean empleados de oficina? 


6.62 La distribución exponencial se aplica con fre- 
cuencia a los tiempos de espera entre éxitos en un proce- 
so de Poisson. Si el número de llamadas que se reciben 
por hora en un servicio de respuesta telefónica es una 
variable aleatoria de Poisson con el parámetro А = 6, 
sabemos que el tiempo, en horas, entre llamadas suce- 
sivas tiene una distribución exponencial con el paráme- 
tro @ = 1/6. ¿Cuál es la probabilidad de esperar más de 
15 minutos entre cualesquiera 2 llamadas sucesivas? 


6.63 Cuando q es un entero positivo n, la distribución 
gamma también se conoce como distribución de Er- 
lang. Al establecer que @ = п en la distribución gamma 
de la página 195, la distribución de Erlang es 


¿n= 1,3] В 
f()= т >» x>0, 
0 


i en otro caso. 


Se puede demostrar que si los tiempos entre eventos 
sucesivos son independientes, y cada uno tiene una dis- 
tribución exponencial con el parámetro 6, entonces el 
tiempo de espera total X transcurrido hasta que ocurran 
n eventos tiene la distribución de Erlang. Con referen- 
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a) ¿Cuál es la probabilidad de que más de 10 auto- 
móviles aparezcan en la intersección durante cual- 
quier minuto determinado? 

b) ¿Cuál es la probabilidad de que transcurran más de 
2 minutos antes de que lleguen 10 autos? 


6.59 Considere la información del ejercicio 6.58. 
a) ¿Cuál es la probabilidad de que transcurra más de 
1 minuto entre llegadas? 
b) ¿Cuál es el número medio de minutos que transcu- 
rre entre las llegadas? 


6.60 Demuestre que la función de la tasa de fallas es 
dada por 


Z()=08'*, 1>0, 


si y sólo si la distribución del tiempo que transcurre 
antes de la falla es la distribución de Weibull 


РО) =о@#7!е-“®", т>о. 


cia al ejercicio de repaso 6.62, ¿cuál es la probabilidad 
de que las siguientes 3 llamadas se reciban dentro de 
los siguientes 30 minutos? 


6.64 Un fabricante de cierto tipo de máquina grande 
desea comprar remaches de uno de dos fabricantes. Es 
importante que la resistencia a la rotura de cada rema- 
che exceda 10,000 psi. Dos fabricantes (A y B) ofrecen 
este tipo de remache y ambos tienen remaches cuya re- 
sistencia a la rotura está distribuida de forma normal. 
Las resistencias promedio a la rotura para los fabricantes 
A y B son 14,000 psi y 13,000 psi, respectivamente. Las 
desviaciones estándar son 2000 psi y 1000 psi, respec- 
tivamente. ¿Cuál fabricante producirá, en promedio, el 
menor número de remaches defectuosos? 


6.65 De acuerdo con un censo reciente, casi 65% de 
los hogares en Estados Unidos se componen de una о 
dos personas. Si se supone que este porcentaje sigue 
siendo válido en la actualidad, ¿cuál es la probabilidad 
de que entre 590 y 625 de los siguientes 1000 hogares 
seleccionados al azar en Estados Unidos consten de 
una o dos personas? 


6.66 Cierto tipo de dispositivo tiene una tasa de fallas 
anunciada de 0.01 por hora. La tasa de fallas es cons- 
tante y se aplica la distribución exponencial. 
a) ¿Cuál es el tiempo promedio que transcurre antes 
de la falla? 
b) ¿Cuál es la probabilidad de que pasen 200 horas 
antes de que se observe una falla? 
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6.67 En una planta de procesamiento químico es im- 
portante que el rendimiento de cierto tipo de producto 
de un lote se mantenga por arriba de 80%. Si permane- 
ce por debajo de 80% durante un tiempo prolongado, la 
empresa pierde dinero. Los lotes producidos ocasional- 
mente con defectos son de poco interés, pero si varios 
lotes por día resultan defectuosos, la planta se detiene y 
se realizan ajustes. Se sabe que el rendimiento se distri- 
buye normalmente con una desviación estándar de 4%. 
a) ¿Cuál es la probabilidad de una “falsa alarma” 
(rendimiento por debajo de 80%) cuando el rendi- 

miento promedio es en realidad de 85%? 
b) ¿Cuál es la probabilidad de que un lote tenga un 
rendimiento que exceda el 80% cuando en reali- 

dad el rendimiento promedio es de 79%? 


6.68 Para un componente eléctrico que tiene una tasa 
de fallas de una vez cada 5 horas es importante consi- 
derar el tiempo que transcurre para que fallen 2 com- 
ponentes. 

a) Suponiendo que se aplica la distribución gamma, 
¿cuál es el tiempo promedio que transcurre para 
que fallen 2 componentes? 

b) ¿Cuál es la probabilidad de que transcurran 12 ho- 
ras antes de que fallen 2 componentes? 


6.69 Se establece que la elongación de una barra de 
acero bajo una carga particular se distribuye normal- 
mente con una media de 0.05 pulgadas y с = 0.01 
pulgadas. Calcule la probabilidad de que el alarga- 
miento esté 

a) por arriba de 0.1 pulgadas; 

b) por abajo de 0.04 pulgadas; 

c) entre 0.025 y 0.065 pulgadas. 


6.70 Se sabe que un satélite controlado tiene un error 
(distancia del objetivo) que se distribuye normalmente 
con una media О y una desviación estándar de 4 pies. El 
fabricante del satélite define un éxito como un disparo 
en el cual el satélite llega a 10 pies del objetivo. Calcu- 
le la probabilidad de que el satélite falle. 


6.71 Un técnico planea probar cierto tipo de resina 
desarrollada en el laboratorio para determinar la natu- 
raleza del tiempo que transcurre antes de que se logre 
el pegado. Se sabe que el tiempo promedio para el pe- 
gado es de 3 horas y que la desviación estándar es de 
0.5 horas. Un producto se considerará indeseable si el 
tiempo de pegado es menor de una hora o mayor de 
4 horas. Comente sobre la utilidad de la resina. ¿Con 
qué frecuencia su desempeño se considera indeseable? 
Suponga que el tiempo para la unión se distribuye nor- 
malmente. 


6.72 Considere la información del ejercicio de repaso 
6.66. ¿Cuál es la probabilidad de que transcurran me- 
nos de 200 horas antes de que ocurran 2 fallas? 


Capítulo 6 Algunas distribuciones continuas de probabilidad 


6.73 Para el ejercicio de repaso 6.72, ¿cuál es la me- 
dia y la varianza del tiempo que transcurre antes de que 
ocurran 2 fallas? 


6.74 Se sabe que la tasa promedio de uso de agua (en 
miles de galones por hora) en cierta comunidad implica 
la distribución logarítmica normal con los parámetros 
p=5 ус = 2. Para propósitos de planeación es impor- 
tante tener información sobre los periodos de alto con- 
sumo. ¿Cuál es la probabilidad de que, para cualquier 
hora determinada, se usen 50,000 galones de agua? 


6.75 Рага el ejercicio de repaso 6.74, ¿cuál es la me- 
dia del uso de agua por hora promedio en miles de ga- 
lones? 


6.76 Еп el ejercicio 6.54 de la página 206 se supone 
que la vida de un transistor tiene una distribución gam- 
ma con una media de 10 semanas y una desviación es- 
tándar de V50 semanas. Suponga que la distribución 
gamma es incorrecta y que se trata de una distribu- 
ción normal. 
a) ¿Cuál es la probabilidad de que el transistor dure a 
lo sumo 50 semanas? 
b) ¿Cuál es la probabilidad de que el transistor no so- 
breviva las primeras 10 semanas? 
с) Comente acerca de la diferencia entre los resulta- 
dos que obtuvo aquí y los que se obtuvieron en el 
ejercicio 6.54 de la página 206. 


6.77 La distribución beta tiene muchas aplicaciones 
en problemas de confiabilidad, donde la variable alea- 
toria básica es una proporción, como sucede en el con- 
texto práctico que se ilustra en el ejercicio 6.50 de la 
página 206. En este apartado considere el ejercicio de 
repaso 3.73 de la página 108. Las impurezas en el lote 
del producto de un proceso químico reflejan un proble- 
ma grave. Se sabe que la proporción de impurezas Y en 
un lote tiene la siguiente función de densidad 


10(1 =y)’, 

ХО) = |. 

a) Verifique que la anterior sea una función de densi- 
dad válida. 

b) ¿Cuál es la probabilidad de que un lote se conside- 
re no aceptable (es decir, Y > 0.6)? 

c) ¿Cuáles son los parámetros о y {3 de la distribu- 
ción beta que se ilustra aquí? 

d) La media de la distribución beta es ET] ¿Cuál es la 
proporción media de impurezas en el lote? 

e) La varianza de una variable aleatoria beta distri- 
buida es 


0<y<l, 
en otro caso. 


g= aß 
(а + Ba+pB+1)' 


¿Cuál es la varianza de Y en este problema? 


6.11 Posibles riesgos y errores. Relación con el material de otros capítulos 


6.78 Considere ahora el ejercicio de repaso 3.74 de la 
página 108. La función de densidad del tiempo Z entre 
las llamadas, en minutos, a una empresa de suministro 
eléctrico es dada por 
T e” z/ 10 
= ) 10 > 
Fi) | 
a) ¿Cuál es el tiempo medio entre llamadas? 
b) ¿Cuál es la varianza en el tiempo entre llamadas? 
с) ¿Cuál es la probabilidad de que el tiempo entre 
llamadas supere la media? 


0<z<oo, 
en otro caso. 


6.79 Considere el ejercicio de repaso 6.78. Dada la 
suposición de la distribución exponencial, ¿cuál es el 
número medio de llamadas por hora? ¿Cuál es la va- 
rianza en el número de llamadas por hora? 


6.80 En un proyecto experimental sobre el factor hu- 
mano se determinó que el tiempo de reacción de un 
piloto ante un estímulo visual es distribuido normal- 
mente con una media de 1/2 segundo y una desviación 
estándar de 2/5 de segundo. 
a) ¿Cuál es la probabilidad de que una reacción del 
piloto tome más de 0.3 segundos? 
b) ¿Qué tiempo de reacción se excede el 95% de las 
veces? 


6.81 El tiempo que transcurre entre las fallas de una 
pieza esencial de equipo es importante en la decisión 
del uso de equipo auxiliar. Un ingeniero cree que el 
mejor modelo para el tiempo entre las fallas de un ge- 
nerador es la distribución exponencial con una media 
de 15 días. 
a) Siel generador acaba de fallar, ¿cuál es la probabi- 
lidad de que falle en los siguientes 21 días? 
b) ¿Cuál es la probabilidad de que el generador fun- 
cione durante 30 días sin fallar? 


6.82 El periodo de vida de una broca en una operación 
mecánica, en horas, tiene una distribución de Weibull 
con Y = 2 y 8 = 50. Calcule la probabilidad de que la 
broca falle antes de 10 horas de uso. 


6.83 Calcule la fda para la distribución de Weibull. 
[Sugerencia: En la definición de una fda haga la trans- 
formación z = y?]. 


6.84 Explique por qué la naturaleza del escenario en 
el ejercicio de repaso 6.82 probablemente no se preste 
a la distribución exponencial. 
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6.85 А partir de la relación entre la variable aleatoria 
chi cuadrada y la variable aleatoria gamma, demuestre 
que la media de la variable aleatoria chi cuadrada es v 
y que la varianza es 2v. 


6.86 El tiempo que le toma a un usuario de compu- 
tadora leer su correo electrónico, en segundos, se distri- 
buye como una variable aleatoria logarítmica normal 
con u = 1.8 y o° = 4.0. 

a) ¿Cuál es la probabilidad de que el usuario lea el 
correo durante más de 20 segundos? ¿Y por más 
de un minuto? 

b) ¿Cuál es la probabilidad de que el usuario lea el 
correo durante un tiempo que sea igual a la media 
de la distribución logarítmica normal subyacente? 


6.87 Proyecto de grupo: Pida a grupos de estudian- 
tes que observen durante 2 semanas el número de per- 
sonas que entra a una cafetería o restaurante de comida 
rápida específico en el transcurso de una hora, empe- 
zando a la misma hora cada día. La hora deberá ser la 
de mayor tránsito en la cafetería o restaurante. Los da- 
tos reunidos corresponderán al número de clientes que 
entran al lugar durante cada lapso de media hora. De 
esta manera, cada día se recolectarán 2 datos. Suponga- 
mos que la variable aleatoria X, el número de personas 
que entra cada media hora, tiene una distribución de 
Poisson. Los estudiantes deberán calcular la media y la 
varianza muestrales de X utilizando los 28 datos obte- 
nidos. 

a) ¿Qué evidencia hay de que la distribución de Pois- 
son es o no correcta? 

b) Dado que X es una variable de Poisson, ¿cuál es la 
distribución de T, el tiempo entre la llegada de las 
personas al lugar durante un lapso de media hora? 
Proporcione un estimado numérico del parámetro 
de esa distribución. 

с) Proporcione un estimado de la probabilidad de que 
el lapso de tiempo entre las 2 llegadas sea menor 
de 15 minutos. 

d) ¿Cuál es la probabilidad estimada de que el lapso 
entre las 2 llegadas sea mayor de 10 minutos? 

е) ¿Cuál es la probabilidad estimada de que 20 minu- 
tos después de iniciar la recolección de datos nin- 
gún cliente haya llegado? 


6.11 Posibles riesgos y errores conceptuales; relación con el material 


de otros capítulos 


Muchos de los riesgos en el uso del material de este capítulo son muy similares a los del 
capítulo 5. Uno de los peores abusos de la estadística consiste en suponer que se trata de 
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una distribución normal haciendo algún tipo de inferencia estadística, cuando en reali- 
dad no es normal. En los capítulos 10 al 15 el lector estudiará las pruebas de hipótesis, 
en las que se asume normalidad. Además, se le recordará al lector que hay pruebas de 
la bondad de ajuste, además de las rutinas gráficas que se examinan en los capítulos 8 
y 10, que permiten verificar los datos para determinar si es razonable la suposición de 
normalidad. 

Debemos hacer advertencias similares con respecto a las suposiciones que a menu- 
do se hacen sobre otras distribuciones, además de la curva normal. En este libro se han 
presentado ejemplos en los que es necesario calcular las probabilidades de falla de cier- 
tos productos o la probabilidad de recibir una queja durante cierto periodo. Se suelen 
hacer suposiciones con respecto a cierto tipo de distribución, así como a los valores de 
los parámetros de la distribución. Observe que los problemas de ejemplo incluyen los 
valores de los parámetros (por ejemplo, el valor de (8 para la distribución exponencial). 
No obstante, en los problemas de la vida real los valores de los parámetros deben ser 
estimaciones de experiencias o datos reales. Observe el énfasis que se pone en la estima- 
ción en los proyectos que aparecen en los capítulos 1, 5 y 6, así como la referencia que 
se hace en el capítulo 5 a las estimación de parámetros, tema que se analizará amplia- 
mente a partir del capítulo 9. 


Capítulo 7 


Funciones de variables aleatorias 
(opcional) 


7.1 Introducción 


Este capítulo contiene un amplio espectro de material. Los capítulos 5 y 6 tratan tipos es- 
pecíficos de distribuciones, tanto discretas como continuas. Éstas son distribuciones que 
suelen aplicarse en muchos campos, por ejemplo en el de la confiabilidad, el de control 
de calidad y el de muestreo de aceptación. En este capítulo comenzamos a estudiar un 
tema más general: el de la distribución de funciones de variables aleatorias. Se presentan 
las técnicas generales y se ilustran con ejemplos. Las presentaciones van seguidas por un 
concepto relacionado, el de funciones generadoras de momentos, que pueden ser útiles 
para el aprendizaje de distribuciones de funciones lineales de variables aleatorias. 

En los métodos estadísticos estándar, el resultado de la prueba de hipótesis estadís- 
ticas, la estimación, o incluso las gráficas estadísticas, no involucra a una sola variable 
aleatoria sino a funciones de una o más variables aleatorias. Como resultado, la inferen- 
cia estadística requiere la distribución de tales funciones. Por ejemplo, es común que se 
utilicen promedios de variables aleatorias. Además, las sumatorias y las combinacio- 
nes lineales más generales son importantes. Con frecuencia nos interesa la distribución 
de las sumas de cuadrados de variables aleatorias, en particular la manera en que se utili- 
zan las técnicas del análisis de varianza, las cuales se estudiarán en los capítulos 11 a 14. 


7.2 Transformaciones de variables 


Con frecuencia, en la estadística se enfrenta la necesidad de derivar la distribución de 
probabilidad de una función de una o más variables aleatorias. Por ejemplo, suponga que 
X es una variable aleatoria discreta con distribución de probabilidad f(x), suponga 
también que Y = u (X) define una transformación uno a uno entre los valores de X y Y. 
Queremos encontrar la distribución de probabilidad de Y. Es importante notar que la 
transformación uno a uno implica que cada valor x está relacionado con un, y sólo un, 
valor y = u(x), y que cada valor y está relacionado con un, y sólo un, valor x = w(y), 
donde w(y) se obtiene al resolver y = u(x) para x en términos de y. 
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Teorema 7.1: 


Capítulo 7 Funciones de variables aleatorias (opcional) 


A partir de lo expuesto respecto a las distribuciones de probabilidad discreta en el 
capítulo 3, nos quedó claro que la variable aleatoria Y toma el valor y cuando X toma 
el valor w(y). En consecuencia, la distribución de probabilidad de Y es dada por 


80) = P(Y = y) = P IX = wO)] = f 0). 


Suponga que X es una variable aleatoria discreta con distribución de probabilidad f(x). 
Definamos con Y = u(X) una transformación uno a uno entre los valores de X y Y, de 
manera que la ecuación y = u(x) se resuelva exclusivamente para x en términos de y, 
digamos, x = w(y). Entonces, la distribución de probabilidad de Y es 


20) =f iw). 


Ejemplo 7.1: | Sea X una variable aleatoria geométrica con la siguiente distribución de probabilidad 


Solución: 


Teorema 7.2: 


3 1\7! 
Pasi) › жей 


Calcule la distribución de probabilidad de la variable aleatoria Y = X?. 
Como todos los valores de X son positivos, la transformación define una corresponden- 
cia uno a uno entre los valores x y y, y = X y x = Vy- Por lo tanto, 


gO) = 


а у, ушаб... 


en cualquier caso. J 


De manera similar, para una transformación de dos dimensiones, tenemos el resul- 
tado en el teorema 7.2. 


Suponga que X, y X, son variables aleatorias discretas, con distribución de probabilidad 
conjunta f(x,, x,). Definamos con Y, = u (X, X,) y Y, = u (X, X,) una transformación 
uno a uno entre los puntos (x,, x,) y O. y) de manera que as ecuaciones 


yı = ш1(х1,х2) Y у =Ux(x1,x2) 


se pueden resolver exclusivamente para x, y х, en términos de y, y y,, digamos х, = w, 
(у, Ya) у xX, = %, (у), y,). Entonces, la distribución de probabilidad conjunta de Y, y 0 es 


201,2) = f [w101,y2),w20 1, y2)1. 


El teorema 7.2 es muy útil para encontrar la distribución de alguna variable aleatoria 
Y, = u (X, X,), donde X, y X, son variables aleatorias discretas con distribución de pro- 
babilidad conjunta f(x, х,). Definimos simplemente una segunda función, digamos Y, = 
u(X,, X,), manteniendo una correspondencia uno a uno entre los puntos (х, х,) y (у, Y,), 
y obtenemos la distribución de probabilidad conjunta g(y,, y,). La distribución de Y 
es precisamente la distribución marginal de g(y,, y,) que se encuentra sumando los valo- 
res y,. Si denotamos la distribución de Y, con A(y,), podemos escribir 


hi) = X 201,y2). 
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Ejemplo 7.2: | Sean X ‚ y X, dos variables aleatorias independientes que tienen distribuciones de Poisson 


Solución: 


Teorema 7.3: 


con los parámetros и y и,, respectivamente. Calcule la distribución de la variable alea- 
toria Y = Х +X. 
Como X, y X, son independientes, podemos escribir 
et eh už? -(ш +42) 
fr) =f af (хз) = aa Б сила 
х1: 


x2! xixa! 


donde x, = 0, 1, 2,... y x, = 0, 1, 2,.... Definamos ahora una segunda variable aleatoria, 
digamos Y, = X,. Las funciones inversas son dadas por x, = y, — y, Y X, = у,. Si usamos 
el teorema °7. 2, encontramos que la distribución de probabilidad conjunta de Y, y Y, es 


em +)! сэз? 


(у1,уә) = 
ыу (ут = y2)!y2! 


donde у = O, 1, 2,... y У, = 0: 1.2.5 у: Advierta que, сото x> 0, la transformación 
x, = y, — x, implica que у, y, por lo tanto, x, siempre deben ser menores o iguales que y,. 
En consecuencia, la distribución de probabilidad marginal de Y, es 


yı TES 
2 po? 
h(y1) = Yi) AR ————————— 
2. NE bi —y2)!y2! 
ет“ +) yı yı! 
yı! 0 y2!01 = y2)! 


=(pi+po) Y 
_ e yı Y1—Y2 ,,y2 
yl уз Ge i 


i= ¿LO 


Ha 


Al reconocer esta suma como la expansión binomial de (и, + 4,)”, obtenemos 


— (Hı +p2) yı 
h) = © а A a 


yı! 


a partir de lo cual concluimos que la suma de las dos variables aleatorias independientes 
que tienen distribuciones de Poisson, соп los parámetros и, y u, tiene una distribución 
de Poisson con el parámetro и, + и. J 

Para calcular la distribución de probabilidad de la variable aleatoria Y = u(X), 
cuando X es una variable aleatoria continua y la transformación es uno a uno, necesita- 
remos el teorema 7.3. La demostración de este teorema se deja al lector. 


Suponga que X es una variable aleatoria continua con distribución de probabilidad f(x). 
Definamos con Y = u(X) una correspondencia uno a uno entre los valores de X y Y, de 
manera que la ecuación y = u(x) se resuelva exclusivamente para x en términos de y, 
digamos x = w(y). Entonces, la distribución de probabilidad de Y es 


280) = iwN] l, 


donde J = w(y) y se Пата jacobiano de la transformación. 
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Ejemplo 7.3: | Sea X una variable aleatoria continua con la siguiente distribución de probabilidad 


ra= (E 9; 


0, en cualquier caso. 


Calcule la distribución de probabilidad de la variable aleatoria Y = 2X – 3. 
Solución: La solución inversa de y = 2x – 3 produce x = (y + 3)/2, de la que obtenemos J = w'y) 
= dx/dy = 1/2. Por lo tanto, usando el teorema 7.3 encontramos que la función de den- 
sidad de Y es 


(›+3)/2 үтү — y+3 
¿e оз lla. =1 <=» 
0, en cualquier caso. 3 


Para calcular la distribución de probabilidad conjunta de las variables aleatorias 
Ү = u (X, X) y Y, = u (X, X,), cuando X, y X, son continuas y la transformación es uno 
a uno, necesitamos un teorema adicional análogo al teorema 7.2, el cual establecemos 
sin demostración. 


Teorema 7.4: Suponga que X, y X, son variables aleatorias continuas con distribución de probabili- 
dad conjunta f(x,, х,). Definamos con Y, = и (X, X,) y Y, = и(Х,, X,) una transforma- 
ción uno а uno entre los puntos (х, x,) y (у, y,), de manera que las ecuaciones y, = 
u (xp X) у y, = U(x,, x,) se resuelven exclusivamente para x, у x, en términos de y, y y,, 
digamos x, = wO; у) y x, = W,0, y,). Entonces, la distribución de probabilidad con- 
junta de Y, y Y,es 


5071,52) = f [w 01, y2),w201,y2D]1 |, 


donde el jacobiano es el determinante 2 х 2 


ðxı дхі 

дуу ду» 
di = 

Ox рл дх 2 

ду 1 ду 2 


у a es simplemente la derivada de x, = у (у), y,) respecto a y,, con y, constante, que 


en cálculo se denomina derivada parcial de x, respecto a у. Las otras derivadas parciales 
se definen de manera similar. 


Ejemplo 7.4: | Sean X, y X, dos variables aleatorias continuas con la siguiente distribución de probabi- 
lidad conjunta 
Axix2, O<x <1, 0 <хә < 1, 


f(x1,x2) == | 


0, en cualquier caso. 


Calcule la distribución de probabilidad conjunta de Y, = X 2 y Y% = ХХ. 
Solución: Las soluciones inversas de у = х2 y уз =x1X2 ѕоп ху = f1 Y X2 = уз / 5; de 
las que obtenemos 


(ey о |_1 
IM? 1/уў D 
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Para determinar el conjunto В de puntos en el plano y y, en el que se traza el conjunto A 
de puntos en el plano x,x, escribimos 


ху=у y  x=>Y/yYy- 


Luego, al establecer x, = 0, х, = 0, x, = 1 y x, = 1, las fronteras del conjunto А se trans- 
forman en y, = 0, у, = 0, y, = 1 y y, =yy1 0 ў = y, Las dos regiones se ilustran en la 
figura 7.1. Al trazar el conjunto А = ((x,,x,)) | O < x, < 1, 0 < x, < 1) en el conjunto 
В = {(y1,y2) | у2 <у < 1, 0 < y2 < 1}, se vuelve evidente que la transformación 
es uno a uno. Del teorema 7.4, la distribución de probabilidad conjunta de Y, y Y, es 


=4 SS УІ 
801,72) SAI г Ji 


ya 1 2 у? <у <1, 0 <у <1, 
0, en cualquier caso. J 


y2 
y 
„А 
q| >» T 
ра В 5 
у; =0 yı 


Figura 7.1: Gráfica del conjunto A en el conjunto B. 


A menudo surgen problemas cuando deseamos encontrar la distribución de pro- 
babilidad de la variable aleatoria Y = u(X) y X es una variable aleatoria continua y la 
transformación no es uno a uno. Es decir, a cada valor x le corresponde exactamente un 
valor y; pero a cada valor y le corresponde más de un valor x. Por ejemplo, suponga que 
fœ) es positiva en el intervalo —1 < x < 2 y сего en cualquier caso. Considere la transfor- 
mación у = х? . En este caso, x = + y/y para 0 < y < 1 y x = уу para 1 < y < 4. Para 
el intervalo 1 < y < 4, la distribución de probabilidad de Y se calcula como antes, con el 
teorema 7.3. Es decir, 


£0) = WONI = CN 


Sin embargo, cuando 0 < y < 1, podemos dividir el intervalo —1 < x < 1 para obtener las 
dos funciones inversas 


x = —х\/у, =1<x<0, y х = p, О<х<1. 
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Entonces, a todo valor y le corresponde un solo valor x para cada partición. En la figura 
7.2 vemos que 


P(a< Y <b=P(=Vb<X< үа) + Р(уа<Х < vb) 


- ya & 
= | ҒО) a+ | f(x) ах. 
=й ya 


~ 
І 
x 


1 1 
1 1 
1 а 1 
1 | 
1 1 
l X 
-1 -vb -va va vb 1 


Figura 7.2: Función decreciente y creciente. 


Al cambiar la variable de integración de x a y, obtenemos 


a b 
Pía <Y <»= f HEN d+ | FOD dy 
b a 


b b 
= -f f(y dy +/ РО) dy, 


donde ГЕ 4(—+/у) = = ==] 
1 ЕТ 27 1 
у а 1 
DA a 
dy 205 


Por lo tanto, podemos escribir 


b 
Pest eje | LEIA +С dy, 


y entonces 


80) = FVII EED] се syai 


7.2 Transformaciones de variables 217 


Teorema 7.5: 


La distribución de probabilidad de Y para 0 < y < 4 se puede escribir ahora como 
м; 0<y < 1, 
= < М») 
80) Ес 1 <у<4, 
0, en cualquier caso. 


Este procedimiento para calcular g(y) cuando O < y < 1 se generaliza en el teorema 
7.5 para k funciones inversas. Para transformaciones de funciones de diversas variables 
que no son uno a uno se recomienda al lector Introduction to Mathematical Statistics de 
Hogg, McKean y Craig (2005; véase la bibliografía). 


Suponga que X es una variable aleatoria continua con distribución de probabilidad f(x). 
Definamos con Y = u(X) una transformación entre los valores de X y Y que no es uno a 
uno. Si el intervalo sobre el que se define X se puede dividir en k conjuntos mutuamen- 
te disjuntos de manera que cada una de las funciones inversas 


xı = (у), Xx2=W20)), ..., Xk =W0) 


de y = u(x) defina una correspondencia uno a uno, entonces la distribución de probabi- 
lidad de Y es 


К 
20) = У: (01174, 
=! 


donde J; = у; (у), i = 1,2,...,k. 


Ejemplo 7.5: | Demuestre que Y = (X — u)/0? tiene una distribución chi cuadrada con 1 grado de liber- 


Solución: 


tad cuando X tiene una distribución normal con media u y varianza o”. 
Sea Z = (X — и)/с, donde la variable aleatoria Z tiene la distribución normal estándar 


1 „2 
[у= n cun =0<z<00. 


от: 


Ahora debemos calcular la distribución de la variable aleatoria Y = 22. Las soluciones 
inversas de y = 2° son z = + yy. Si designamos z, = -VY y z, = y/y, entonces J, = —1/2 
уу y J, = -1/2/y. Entonces, por el teorema 7.5, tenemos 


A z5 = ЕР 
т [уж [у ут 


Como g(y) es una función de densidad, se deduce que 


оо œ 1/2—1„—у/2 
2 / 2-16-02 ду = = yle a = 00), 
VIT Jo VT Jo М?га/?) ут 


la integral es el área bajo una curva de probabilidad gamma con los parámetros œ = 1/2 
y В = 2. Por lo tanto, y г = Г(1/2) y la densidad de Y es dada por 


1 1/2-1 ¿=y/2 
ey) = 4 Ута У а 
А en cualquier caso. 


ее y > 0. 


que se considera una distribución chi cuadrada con 1 grado de libertad. JJ 
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7.3 Momentos y funciones generadoras de momentos 


En esta sección nos concentramos en aplicaciones de las funciones generadoras de mo- 
mentos. El propósito evidente de la función generadora de momentos es la determinación 
de los momentos de variables aleatorias. Sin embargo, la contribución más importante 
consiste en establecer distribuciones de funciones de variables aleatorias. 

Si g(X) = Х' para r = 0, 1, 2, 3,..., la definición 7.1 proporciona un valor esperado 
que se denomina r-ésimo momento alrededor del origen de la variable aleatoria X, que 
denotamos con u’. 


Definición 7.1: El r-ésimo momento alrededor del origen de la variable aleatoria X es dado por 


, А ИО si Х es discreta, 
Hr = E(X') = + 
$. f(x) dx, si X es continua. 


Como el primer y segundo momentos alrededor del origen son dados роги = E(X) y и» 
= E(X?), podemos escribir la media y la varianza de una variable aleatoria como 


р=щ y а= – 2. 


Aunque los momentos de una variable aleatoria se pueden determinar directamente 
a partir de la definición 7.1, existe un procedimiento alternativo, el cual requiere que uti- 
licemos una función generadora de momentos. 


Definición 7.2: La función generadora de momentos de la variable aleatoria X es dada por E(e”), y se 


denota соп М, (7). Por lo tanto, 


Беу (у si X es discreta, 
Mx (т) = Ele) = 4 х. 
| Кел (хх es continua. 


Las funciones generadoras de momentos existirán sólo si la sumatoria o integral de 
la definición 7.2 converge. Si existe una función generadora de momentos de una varia- 
ble aleatoria X, se puede utilizar para generar todos los momentos de dicha variable. El 
método se describe en el teorema 7.6 sin demostración. 


Teorema 7.6: Sea X una variable aleatoria con función generadora de momentos M (t). Entonces, 


йМ х(ї) 
dt" 


Ejemplo 7.6: | Calcule la función generadora de momentos de la variable aleatoria binomial X y des- 
pués utilícela para verificar que и = np y 0? = npq. 
Solución: A partir de la definición 7.2 tenemos 


Mx(t) = Уе" (r g= = 5 (jeere 
х=0 


х=0 
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Al reconocer a esta última sumatoria como la expansión binomial de (ре! + q)” obtenemos 
Mx(t) = (ре +q)". 


Así, ам 
[4 
xW =n(pe' + ape 
t 
y 
ФМ (1 
fxd ) =nple' (n = 1)(ре' + q" pe +H pe! + 4)" 1е']. 


Al establecer t = 0 obtenemos 


Шш = пр уш, = пр[(п — Dp + 1. 
Por consiguiente, 


=p, = пр y а? = p, – Ш? = пр(1 —р) = пра, 


que coincide con los resultados que se obtuvieron en el capítulo 5. J 


Ejemplo 7.7: | Demuestre que la función generadora de momentos de la variable aleatoria X, la cual 
tiene una distribución de probabilidad normal con media и y varianza o°, es dada por 


Mx (t) = exp (u + 50%) ; 


Solución: A partir de la definición 7.2, la función generadora de momentos de la variable aleatoria 
normal X es 


2 
Mx (t) =f . Р Бер (* =”) E 
x? — 20р +t0?)x + и? 
-f Vino Ж 20? ш 


Si completamos el cuadrado еп el exponente, podemos escribir 


2 Ap + to?) + и? = [х — (и +10?) – ша? – tot 


y, entonces, 


_ i [х — (u + t0?)? – 2uto?— 2а“ 
mo= f mo | 207 dx 


2ш + с? [х — (и +102) 
= exp (EE ) 1 == e pas. 


Sea w = [x — (u + t0?)l/0 ; entonces dx = O dw y 


1 A! 2 1 
Му (г) = t z 212 > _„-#/2 dw = t aa 212 А 
y(t) = exp ( + z7 TN Уп" w = exp | ut + z7 
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Teorema 7.7: 


Teorema 7.8: 


Prueba: 
Teorema 7.9: 
Prueba: 


Teorema 7.10: 
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ya que la última integral representa el área bajo una curva de densidad normal estándar 
y, en consecuencia, es igual a 1. J 

Aunque el método de transformación de variables brinda una forma eficaz para de- 
terminar la distribución de una función de múltiples variables, existe un procedimiento 
alternativo, y que a menudo se prefiere cuando la función a analizar es una combinación 
lineal de variables aleatorias independientes. Este procedimiento utiliza las propiedades 
de las funciones generadoras de momentos que se estudian en los siguientes cuatro teo- 
remas. Para no rebasar el alcance matemático de este libro, establecemos el teorema 7.7 
sin demostración. 


(Teorema de unicidad) Sean X y Y dos variables aleatorias con funciones generadoras 


de momentos M(t) y M (t), respectivamente. 51 M_(t) = M (t) para todos los valores de 
t, entonces X y Y tienen la misma distribución de probabilidad. 


Mx + a(t) = e” Mx(0. 


Mx+a(t) = Ele +9] = e“ E (e) = е“ Му (0). JJ 
Max (t) = Mx (at). 
Max (t) = Ele 20] = E [eX ] = Mx (at). gJ 


Si Жр X,,... , X, ѕоп variables aleatorias independientes con funciones generadoras de 
momentos M,(0, M,(0,..., M, (£), respectivamente, y Y = X, + X, +... + X „ entonces, 


My(t) = Mx (0 Mx, (t) - - - Мх, (0. 


La demostración del teorema 7.10 se deja al lector. 

Los teoremas 7.7 a 7.10 son fundamentales para entender las funciones generadoras 
de momentos. A continuación se presenta un ejemplo como ilustración. Hay muchas 
situaciones en que necesitamos conocer la distribución de la suma de las variables alea- 
torias. Podemos utilizar los teoremas 7.7 y 7.10, así como el resultado del ejercicio 7.19 
de la página 224, para calcular la distribución de una suma de dos variables aleatorias 
independientes de Poisson, con funciones generadoras de momentos dadas por 


Му, (£) = -D y My, (0) = е0 0, 


respectivamente. De acuerdo con el teorema 7.10, la función generadora de momentos 
de la variable aleatoria Y, = X, + X, es 


My, (0) = Му (0) Му, (0 = ¿ate = 1) оное 1) = ош +02) —1) 
y, (0 Х| Xa > 


que de inmediato identificamos como la función generadora de momentos de una va- 
riable aleatoria que tiene una distribución de Poisson con el parámetro и, + и,. Por lo 
tanto, de acuerdo con el teorema 7.7, de nuevo concluimos que la suma de dos variables 
aleatorias independientes, que tienen distribuciones de Poisson con los parámetros и, y 
и, tiene una distribución de Poisson con el parámetro џи, + и,. 
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Combinaciones lineales de variables aleatorias 


Teorema 7.11: 


Teorema 7.12: 


En estadística aplicada a menudo se necesita conocer la distribución de probabilidad de 
una combinación lineal de variables aleatorias normales independientes. Obtengamos la 
distribución de la variable a Y = a X, + a, X, cuando X, es una variable normal 
con media и, y varianza o? y X, también es una variable normal, pero independiente de 
X, con media џи, y varianza 0%. Primero, por medio del teorema 7.10, obtenemos 


My (ї) = Ma x, (Ма, x (0), 
y después, usando el teorema 7.9, obtenemos 
My(t) = Mx, (а11) Мх, (a2t). 
Si sustituimos a, рог t, y despues a,t por t, en una función generadora de momentos de 
la distribución normal derivada en el ы 7.7, tenemos 
My(t) = ехр(а ші + ajo t7/2 + ано! + a031/2) 
=exp[(a¡u + а): + (alo? + az03)1/21, 


que reconocemos como la función вепегайога de momentos de una distribución que es 
2 22 
normal, con media аи, + а,и, y varianza ат а? + а2о?2. 
Al generalizar para el caso de п variables normales independientes, establecemos el 


siguiente resultado. 


51Х,, X,,..., Х son variables aleatorias os que tienen distribuciones norma- 
les con acts и, м»... и, У varianzas 07, 07,.... 0, respectivamente, entonces la varia- 
ble aleatoria 


п” 
} == а! Ху + а Хә +++. an An 
tiene una distribución normal con media 
Hy = аш + ао 5: + an Hn 


y varianza 2 аа 3A а 
Oy = 410i + 4505 +: +a, On. 


Ahora es evidente que la distribución de Poisson y la distribución normal tienen 
una propiedad reproductiva, en el sentido de que la suma de variables aleatorias inde- 
pendientes que tengan cualquiera de estas distribuciones es una variable aleatoria que 
también tiene el mismo tipo de distribución. La distribución chi cuadrada también posee 
esta propiedad reproductiva. 


S1X,, X,,..., Х son variables aleatorias mutuamente independientes, que tienen distribu- 
ciones chi cuadrada con у, у,,..., v, grados de libertad, respectivamente, entonces la 


variable aleatoria 
Y=X; + Х ¿pes Pa 


tiene una distribución chi cuadrada con v = v, + v, +...+ v, grados de libertad. 


Prueba: Por medio del teorema 7.10 y el ejercicio 7.21, 


Му (t) = Mx, (t)Mx, (t) Mx, (t) y Mx (0) =(U- A, = A 
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Corolario 7.1: 
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Por lo tanto, 
Му( = (1-29 "1-29"... (1 — 20) —'"/? =(1-2 Mt +9), 


que reconocemos como la función generadora de momentos de una distribución chi 
cuadrada con v = v, + v, +...+ v, grados de libertad. JJ 


51Х,, X,- X, son variables aleatorias independientes que tienen distribuciones norma- 
les idénticas, con media и y varianza o°, entonces la variable aleatoria 


E) 


i=l 


tiene una distribución chi cuadrada con v = n grados de libertad. 


Este corolario es una consecuencia inmediata del ejemplo 7.5, y establece una relación 
entre la muy importante distribución chi cuadrada y la distribución normal. También debe 
brindar al lector una idea muy clara de lo que significa el parámetro llamado grados 
de libertad. En futuros capítulos el concepto de grados de libertad desempeñará un papel 


cada vez más relevante. 


Corolario 7.2: 


Si Х\, X,,..., X, son variables aleatorias independientes y X, tiene una distribución normal 


con media и, y varianza O? para i = 1, 2,..., n, entonces la variable aleatoria 


tiene una distribución chi cuadrada con v = n grados de libertad. 


Ejercicios 


7.1 Sea X una variable aleatoria que tiene la siguiente 
probabilidad 


1 
= Ж? 
rosis 
Calcule la distribución de probabilidad de la variable 
aleatoria Y = 2Х – 1. 


7.2 Sea X una variable aleatoria binomial con la si- 
guiente distribución de probabilidad 


is [E GG х=01,2,3, 


0, en cualquier caso. 


PS 
en cualquier caso. 


Calcule la distribución de probabilidad de la variable 
aleatoria Y = Х. 


7.3 Sean X, y X, variables aleatorias discretas con la 
siguiente distribución multinomial conjunta 


Роп, 0) 


E 2 1 х] 1 х2 5 2—x1-—Xx2 
Xx 2,2 x1 —х›] {4 3 12 


рага x, = 0, 1, 2; х, = 0, 1, 2; х, + x, < 2; y cero en 
cualquier caso. Calcule la distribución de probabilidad 
conjunta de Y = Х, +X, y Y, =X -X 

7.4 Sean X, y X, variables aleatorias discretas con la 
siguiente distribución de probabilidad conjunta 


х1Х2 


SH = 1,2; x2 = 1,2,3, 
Хох) = F en cualquier caso. 


Calcule la distribución de probabilidad de la variable 
aleatoria Y = X X.. 


Ejercicios 


7.5 Si X tiene la siguiente distribución de probabilidad 
1, O<x <l, 
HS |, en cualquier caso. 


Demuestre que la variable aleatoria Y = —21п X tiene 
una distribución chi cuadrada con 2 grados de libertad. 


7.6 Dada la variable aleatoria X con la siguiente dis- 
tribución de probabilidad 


f= 2x, 0O<x<l, 
© |0, en cualquier caso, 


calcule la distribución de probabilidad de Y = 8Х°. 


7.7 La velocidad de una molécula en un gas uniforme 
en equilibrio es una variable aleatoria V, cuya distribu- 
ción de probabilidad es dada por 


as =h? 
по (ye ‚ v>0, 


0, en cualquier caso, 


donde k es una constante adecuada y b depende de 
la temperatura absoluta y de la masa de la molécula. 
Calcule la distribución de probabilidad de la energía 
cinética de la molécula W, donde W = mV?/2. 


7.8 La utilidad de un distribuidor, en unidades de 
$5000, sobre un automóvil nuevo, es dada por Y = X?, 
donde X es una variable aleatoria que tiene la siguiente 
función de densidad 


HS үч =x), O<x<l, 

0, en cualquier caso. 

a) Calcule la función de densidad de probabilidad de 
la variable aleatoria Y. 

b) Utilice la función de densidad de Y para calcular la 
probabilidad de que la utilidad sobre el siguiente 
automóvil nuevo que venda este distribuidor sea 
menor que $500. 


7.9 El periodo hospitalario, en días, para pacientes 
que siguen un tratamiento para cierto tipo de enfer- 
medad del riñón es una variable aleatoria Y = X + 4, 
donde X tiene la siguiente función de densidad 


fF) = Fa ‚ X> 0, 


0, en cualquier caso. 


a) Calcule la función de densidad de probabilidad de 
la variable aleatoria Y. 

b) Utilice la función de densidad de Y para calcular 
la probabilidad de que el periodo hospitalario para 
un paciente que sigue este tratamiento exceda los 
8 días. 


7.10 Las variables aleatorias X y Y, que representan 
los pesos de cremas y chiclosos, respectivamente, en 
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cajas de un kilogramo de chocolates que contienen una 
combinación de cremas, chiclosos y envinados, tienen 
la siguiente función de densidad conjunta 

24xy, 0<х<1,0<у<1,х+у<1, 
f(x, y) = | ' 

0, en cualquier caso. 


a) Calcule la función de densidad de probabilidad de 
la variable aleatoria Z = X + Y. 

b) Utilice la función de densidad de Z para calcular 
la probabilidad de que, en una determinada caja, la 
suma de los pesos de las cremas y los chiclosos sea 
por lo menos 1/2 del peso total, pero menos de 3/4. 


7.11 La cantidad de queroseno en un tanque al ini- 
cio de cualquier día, en miles de litros, es una cantidad 
aleatoria Y, de la cual una cantidad aleatoria X se vende 
durante ese día. Suponga que la función de densidad 
conjunta de estas variables es dada por 


2, 0O<x<y,0<y<l, 
fœ y) = А 
0, en cualquier caso. 


Calcule la función de densidad de probabilidad para la 
cantidad de queroseno que queda en el tanque al final 
del día. 
7.12 Sean X, y X, variables aleatorias independientes 
que tienen cada una la siguiente distribución de proba- 
bilidad в 
et. SO 

fœ) = lo en cualquier caso. 
Demuestre que las variables aleatorias Y, y Y, son inde- 
pendientes cuando Y, = X, + X, y Y, = X MX, + Х,). 


7.13 Una corriente de / amperios que fluye a través 
de una resistencia de R ohms varía de acuerdo con la 
siguiente distribución de probabilidad 


a f6id-—i), 0<i<l, 
f0 = | en cualquier caso. 
Si la resistencia varía independientemente de la co- 
rriente de acuerdo con la siguiente distribución de pro- 
babilidad 
у= эг О<><1, 
з 0, en cualquier caso, 
calcule la distribución de probabilidad para la potencia 
W = PR watts. 
7.14 Sea X una variable aleatoria con la siguiente dis- 
tribución de probabilidad 
Hz, —1<x<l 
2. Z’ > 
fœ) = | en cualquier caso. 


Calcule la distribución de probabilidad de la variable 
aleatoria Y = X?. 
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7.15 Si X tiene la siguiente distribución de probabi- 


lidad 
2(x +1) 
= 9 з 
10) | 


Calcule la distribución de probabilidad de la variable 
aleatoria Y = X?. 


—1<х< 2, 
en cualquier caso. 


7.16 Demuestre que el r-ésimo momento respecto al 
origen de la distribución gamma es 


‚ _ @Г(а@+т) 
MS 


[Sugerencia: Sustituya y = х/ en la integral que define 
и! y después utilice la función gamma para evaluar la 
integral]. 
7.17 Una variable aleatoria X tiene la siguiente distri- 
bución uniforme discreta 
1 
р» A 
Юю =ч * | 
0, en cualquier caso. 
Demuestre que la función generadora de momentos de 
Xes 
е! a К еб ) 


7.18 Una variable aleatoria X tiene la distribución 
geométrica g(x; p) = pq" parax= 1,2, 3,.... Demuestre 
que la función generadora de momentos de X es 


е! 
мие т 


t<lnq, 


y después use M(t) para calcular la media y la varianza 
de la distribución geométrica. 


Capítulo 7 Funciones de variables aleatorias (opcional) 


7.19 Una variable aleatoria X tiene la distribución de 
Poisson p(x; u) = етих! рагах = 0, 1, 2,.... Demuestre 
que la función generadora de momentos de X es 


Е 
M(H) = ен 7. 


Utilice M(t) para calcular la media у la varianza de Іа 
distribución de Poisson. 


7.20 La función generadora de momentos de cierta 
variable aleatoria de Poisson X es dada por 


Mx(t) = еже 0, 
Calcule Р(и- 267 < X < u + 20). 


7.21 Demuestre que la función generadora de то- 
mentos de la variable aleatoria X, que tiene una distri- 
bución chi cuadrada con v grados de libertad, es 


Мх (0) = (1 20)" 2. 


7.22 Соп la función generadora de momentos del 
ejemplo 7.21 demuestre que la media y la varianza de 
la distribución chi cuadrada con v grados de libertad 
son, respectivamente, v y 2v. 


7.23 Si tanto X como Y, distribuidas de manera in- 
dependiente, siguen distribuciones exponenciales con 
parámetro medio 1, calcule las distribuciones de 

а) U=X +Y; 

b) V=X/(X+Y). 


7.24 Mediante la expansión de е“ en una serie de 
Maclaurin y la integración término por término, de- 
muestre que 


Mx(t) = P e” f(x) dx 


‚Р ‚г 
= 1+ш +My ар MA +... 


Capítulo 8 


Distribuciones de muestreo 
fundamentales y descripciones de datos 


8.1 Muestreo aleatorio 


El resultado de un experimento estadístico se puede registrar como un valor numérico o 
como una representación descriptiva. Cuando se lanza un par de dados y lo que nos inte- 
resa es el resultado total, registramos un valor numérico. Sin embargo, si a los estudian- 
tes de cierta escuela se les hacen pruebas de sangre para averiguar cuál es su tipo, podría 
ser más útil una representación descriptiva. La sangre de una persona se puede clasificar 
de 8 maneras. Puede ser AB, A, B u O, cada una con un signo de más o de menos, lo cual 
depende de la presencia o ausencia del antígeno Rh. 

En este capítulo nos enfocamos en el muestreo de distribuciones o poblaciones, y 
estudiamos cantidades tan importantes como la media de la muestra y la varianza de 
la muestra, que serán de importancia fundamental en los capítulos siguientes. Además, 
en los próximos capítulos intentamos introducir al lector al papel que desempeñarán la 
media y la varianza de la muestra en la inferencia estadística. El uso de las computadoras 
modernas de alta velocidad permite a los científicos e ingenieros incrementar enorme- 
mente su uso de la inferencia estadística formal con técnicas gráficas. La mayoría de las 
veces la inferencia formal parece muy árida y quizás incluso abstracta para el profesional 
o el gerente que desea que el análisis estadístico sea una guía para la toma de decisiones. 


Poblaciones y muestras 


Comenzamos esta sección presentando los conceptos de poblaciones y muestras. Ambas 
se mencionan de forma extensa en el capítulo 1; sin embargo, aquí será necesario estu- 
diarlas más ampliamente, en particular en el contexto del concepto de variables aleato- 
rias. La totalidad de observaciones que nos interesan, ya sean de número finito o infinito, 
constituye lo que llamamos población. En alguna época el término población se refería a 
observaciones que se obtenían de estudios estadísticos aplicados a personas. En la actuali- 
dad el estadístico utiliza la palabra para referirse a observaciones sobre cualquier cuestión 
de interés, ya sea de grupos de personas, de animales o de todos los resultados posibles de 
algún complicado sistema biológico o de ingeniería. 
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Definición 8.1: 


Definición 8.2: 
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Una población consta de la totalidad de las observaciones en las que estamos intere- 
sados. 


El número de observaciones en la población se define como el tamaño de la pobla- 
ción. Si en la escuela hay 600 estudiantes que clasificamos de acuerdo con su tipo de 
sangre, decimos que tenemos una población de tamaño 600. Los números en las cartas 
de una baraja, las estaturas de los residentes de cierta ciudad y las longitudes de los pe- 
ces en un lago específico son ejemplos de poblaciones de tamaño finito. En cada caso el 
número total de observaciones es un número finito. Las observaciones que se obtienen al 
medir diariamente la presión atmosférica desde el pasado hasta el futuro, o todas las me- 
diciones de la profundidad de un lago desde cualquier posición concebible son ejemplos 
de poblaciones cuyos tamaños son infinitos. Algunas poblaciones finitas son tan grandes 
que en teoría las supondríamos infinitas, lo cual es cierto si se considera la población 
de la vida útil de cierto tipo de batería de almacenamiento que se está fabricando para 
distribuirla en forma masiva en todo el país. 

Cada observación en una población es un valor de una variable aleatoria X que 
tiene alguna distribución de probabilidad f(x). Si se inspeccionan artículos que salen de 
una línea de ensamble para buscar defectos, entonces cada observación en la población 
podría ser un valor 0 o 1 de la variable aleatoria X de Bernoulli, con una distribución de 
probabilidad 


b(x;1,p) = pq, x=0,1 


donde 0 indica un artículo sin defecto y 1 indica un artículo defectuoso. De hecho, se 
supone que p, la probabilidad de que cualquier artículo esté defectuoso, permanece cons- 
tante de una prueba a otra. En el experimento del tipo de sangre la variable aleatoria X 
representa el tipo de sangre y se supone que toma un valor del 1 al 8. A cada estudiante 
se le asigna uno de los valores de la variable aleatoria discreta. Las duraciones de las ba- 
terías de almacenamiento son valores que toma una variable aleatoria continua que quizá 
tiene una distribución normal. De ahora en adelante, cuando nos refiramos a una “pobla- 
ción binomial”, a una “población normal” o, en general, а la “población f(x)”, aludire- 
mos a una población cuyas observaciones son valores de una variable aleatoria que tiene 
una distribución binomial, una distribución normal о la distribución de probabilidad f(x). 
Por ello, a la media y a la varianza de una variable aleatoria o distribución de probabi- 
lidad también se les denomina la media y la varianza de la población correspondiente. 

En el campo de la inferencia estadística, el estadístico se interesa en llegar a con- 
clusiones respecto a una población, cuando es imposible o poco práctico conocer todo 
el conjunto de observaciones que la constituyen. Por ejemplo, al intentar determinar 
la longitud de la vida promedio de cierta marca de bombilla, sería imposible probarlas 
todas si tenemos que dejar algunas para venderlas. Los costos desmesurados que impli- 
caría estudiar a toda la población también constituirían un factor que impediría hacerlo. 
Por lo tanto, debemos depender de un subconjunto de observaciones de la población que 
nos ayude a realizar inferencias respecto a ella. Esto nos lleva a considerar el concepto 
de muestreo. 


Una muestra es un subconjunto de una población. 


Para que las inferencias que hacemos sobre la población a partir de la muestra 
sean válidas, debemos obtener muestras que sean representativas de ella. Con mucha 
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Definición 8.3: 


frecuencia nos sentimos tentados a elegir una muestra seleccionando a los miembros más 
convenientes de la población. Tal procedimiento podría conducir a inferencias erróneas 
respecto a la población. Se dice que cualquier procedimiento de muestreo que produzca 
inferencias que sobreestimen o subestimen de forma consistente alguna característica de 
la población está sesgado. Para eliminar cualquier posibilidad de sesgo en el procedi- 
miento de muestreo es deseable elegir una muestra aleatoria, lo cual significa que las 
observaciones se realicen de forma independiente y al azar. 

Para seleccionar una muestra aleatoria de tamaño n de una población f(x) defi- 
nimos la variable aleatoria Х, i = 1, 2,..., n, que representa la ¡-ésima medición о 
valor de la muestra que observamos. Si las mediciones se obtienen repitiendo el expe- 
rimento n veces independientes en, esencialmente, las mismas condiciones, las varia- 
bles aleatorias X p > X, constituirán entonces una muestra aleatoria de la población 
fŒ) con valores numéricos x,, x),..., х„. Debido a las condiciones idénticas en las que 
se seleccionan los elementos de la muestra, es razonable suponer que las n variables 
aleatorias X,, X,,..., X, son independientes y que cada una tiene la misma distribución 
de probabilidad f(x). Es decir, las distribuciones de probabilidad de X Т A X, son, 
respectivamente, f(x,), f(x,),..., f(x), y su distribución de probabilidad conjunta es 
/(х1.х2,...,х) = т) хо): Р(х). El concepto de muestra aleatoria se describe 
de manera formal en la siguiente definición. 


Sean X 1? Х,,..., X, variables aleatorias independientes л, cada una con la misma distribu- 
ción de probabilidad f(x). Definimos X É Асе Х„ como una muestra aleatoria de ta- 
maño n de la población f(x) y escribimos su distribución de probabilidad conjunta como 


CAOS КО) = х1) (х2) С Es 


Si se realiza una selección aleatoria de n = 8 baterías de almacenamiento de un pro- 
ceso de fabricación que mantiene las mismas especificaciones, y al registrar la duración 
de cada batería se encuentra que la primera medición x, es un valor de Х|, la segunda 
medición x, es un valor de X,, y así sucesivamente, entonces х, X,,..., х, son los valores 
de la muestra aleatoria Х,, X,,..., Х,. 51 suponemos que la población de vidas útiles de las 
baterías es normal, los valores posibles de cualquier X, i = 1, 2,..., 8 serán exactamente 
los mismos que los de la población original, por consiguiente, X, tiene una distribución 
normal idéntica a la de X. 


8.2 Algunos estadísticos importantes 


Nuestro principal propósito al seleccionar muestras aleatorias consiste en obtener infor- 
mación acerca de los parámetros desconocidos de la población. Suponga, por ejemplo, 
que deseamos concluir algo respecto a la proporción de consumidores de café en Estados 
Unidos que prefieren cierta marca de café. Sería imposible interrogar a cada consumidor 
estadounidense de café para calcular el valor del parámetro p que representa la propor- 
ción de la población. En vez de esto se selecciona una muestra aleatoria grande y se 
calcula la proporción $ de personas en esta muestra que prefieren la marca de café en 
cuestión. El valor р se utiliza ahora para hacer una inferencia respecto a la proporción 
p verdadera. 

Ahora, $ es una función de los valores observados en la muestra aleatoria; ya que 
es posible tomar muchas muestras aleatorias de la misma población, esperaríamos 
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que р variara un poco de una a otra muestra. Es decir, р es un valor de una variable alea- 
toria que representamos con P. Tal variable aleatoria se llama estadístico. 


Definición 8.4: Cualquier función de las variables aleatorias que forman una muestra aleatoria se llama 
estadístico. 


Medidas de localización de una muestra: la media, la mediana 


y la moda muestrales 

En el capítulo 4 presentamos los parámetros и y о?, que miden el centro y la variabilidad 
de una distribución de probabilidad. Éstos son parámetros de población constantes y de 
ninguna manera se ven afectados o influidos por las observaciones de una muestra alea- 
toria. Definiremos, sin embargo, algunos estadísticos importantes que describen las me- 
didas correspondientes de una muestra aleatoria. Los estadísticos que más se utilizan 
para medir el centro de un conjunto de datos, acomodados en orden de magnitud, son la 
media, la mediana y la moda. Aunque los primeros dos estadísticos se expusieron en el 
capítulo 1, repetiremos las definiciones. Sean Х\, Х,,..., X, representaciones de n varia- 
bles aleatorias. 


a) Media muestral: 


n 
Observe que el estadístico X toma el valor x = 1 У) x; cuando X , toma el valor x,, X, 
toma el valor x, y así sucesivamente. El término media muestral se aplica tanto al esta- 
dístico Х сото a su valor calculado x. 
b) Mediana muestral: 
X(n+1)/2> sin es impar, 


1 . 
50/2 + Xn/241), s1n es par. 


= 
| 


La mediana muestral también es una medida de localización que indica el valor central 
de la muestra. En la sección 1.3 se presentan ejemplos de la media muestral y de la me- 
diana muestral. La moda muestral se define de la siguiente manera: 


c) La moda muestral es el valor que ocurre con mayor frecuencia en la muestra. 


Ejemplo 8.1: | Suponga que un conjunto de datos consta de las siguientes observaciones: 


0.32 0.53 0.28 0.37 0.47 0.43 0.36 0.42 0.38 0.43 


La moda de la muestra es 0.43, ya que este valor aparece con más frecuencia que los 
demás. J 

Como se expuso en el capítulo 1, una medida de localización o tendencia central en 
una muestra no da por sí misma una indicación clara de la naturaleza de ésta, de manera 
que también debe considerarse una medida de variabilidad en la muestra. 
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Las medidas de variabilidad de una muestra: la varianza, 
la desviación estándar y el rango de la muestra 


La variabilidad en la muestra refleja cómo se dispersan las observaciones a partir del 
promedio. Se remite al lector al capítulo 1 para un análisis más amplio. Es posible tener 
dos conjuntos de observaciones con las mismas media o mediana que difieran de manera 
considerable en la variabilidad de sus mediciones sobre el promedio. 
Considere las siguientes mediciones, en litros, para dos muestras de jugo de naranja 

envasado por las empresas A y В: 

MuestraA | 0.97 1.00 0.94 1.03 1.06 

MuestraB | 1.06 1.01 0.88 0.91 1.14 


Ambas muestras tienen la misma media, 1.00 litros. Es muy evidente que la em- 
presa А envasa el jugo de naranja con un contenido más uniforme que la В. Decimos 
que la variabilidad o la dispersión de las observaciones a partir del promedio es me- 
nor para la muestra A que para la muestra B. Por lo tanto, al comprar jugo de naranja, 
tendríamos más confianza en que el envase que seleccionemos se acerque al promedio 
anunciado si se lo compramos a la empresa A. 

En el capítulo 1 presentamos varias medidas de la variabilidad de una muestra, como 
la varianza muestral, la desviación estándar muestral y el rango de la muestra. En 
este capítulo nos enfocaremos sobre todo en la varianza de la muestra. Nuevamente, sea 
que Х|, X,,..., X, representan n variables aleatorias. 


a) La varianza muestral: 


1 $ _ 

$ Ухх, —X y. 
п — 1+ 

i=l (8.2.1) 

El valor calculado de $? para una muestra dada se denota соп 52. Observe que 5? 

se define esencialmente como el promedio de los cuadrados de las desviaciones de las 

observaciones a partir de su media. La razón para utilizar п — 1 como divisor, en vez de 


la elección más obvia n, quedará más clara en el capítulo 9. 


Ejemplo 8.2: | Una comparación de los precios de café en 4 tiendas de abarrotes de San Diego, selec- 


Solución: 


cionadas al azar, mostró aumentos en comparación con el mes anterior de 12, 15, 17 y 
20 centavos por bolsa de una libra. Calcule la varianza de esta muestra aleatoria de au- 
mentos de precio. 


Si calculamos la media de la muestra, obtenemos 
_ 124+ 15 + 17 + 20 
х= ка =16 centavos. 


Por lo tanto, 
1 12 — 16)? 15 — 16)? 17 — 16)? 20 — 16)? 


(4° +(=1)2 +0 CO 
Е 3 37 I 
Mientras que la expresión para la varianza de la muestra de la definición 8.6 ilustra mejor 


que S? es una medida de variabilidad, una expresión alternativa tiene cierto mérito, de 
manera que el lector debería conocerla. El siguiente teorema contiene tal expresión. 
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Teorema 8.1: Si $? es la varianza de una muestra aleatoria de tamaño n, podemos escribir 


Prueba: Por definición, 


= -H Da? -ax +X’) 


e —2Х YX, nx? 
i=l i=l И | 


Como en el capítulo 1, a continuación se definen la desviación estándar muestral y 
el rango muestral: 


b) Desviación estándar muestral: 


5 = VS?, 


donde $? es la varianza muestral. 
Permitamos que X_, denote el más grande de los valores X, y X „m €l más pequeño. 


с) Rango muestral: 
R = X máx T X 


mín” 


Ejemplo 8.3: | Calcule la varianza de los datos 3, 4, 5, 6, 6 y 7, que representan el número de truchas 
atrapadas por una muestra aleatoria de 6 pescadores, el 19 de junio de 1996, en el lago 
Muskoka. 


Solución: Encontramos que Da xi = 171, УЭ х; = 31 уп = 6. De aquí, 
i= i=1 


2 К 13 
5 = +5 [(6)(171) – (31)?] = e" 


Por consiguiente, la desviación estándar de la muestra s = yY13/6 = 1.47 y el rango 
muestral es 7-3 = 4 


Ejercicios 
8.1 Defina las poblaciones adecuadas a partir de las с) Se probaron 200 pares de un nuevo tipo de calzado 
cuales se seleccionaron las siguientes muestras: deportivo en un torneo de tenis profesional para 
a) Se llamó por teléfono a personas de 200 casas en determinar su duración y se encontró que, en pro- 
la ciudad de Richmond y se les pidió nombrar al medio, duraron 4 meses. 
candidato por el que votarían en la elección del d) En cinco ocasiones diferentes a una abogada le 
presidente de la mesa directiva de la escuela. tomó 21, 26, 24, 22 y 21 minutos conducir desde 
b) Se lanzó 100 veces una moneda y se registraron 34 su casa en los suburbios hasta su oficina en el cen- 


cruces. tro de la ciudad. 


Ejercicios 


8.2 El tiempo, en minutos, que 10 pacientes esperan 
en un consultorio médico antes de recibir tratamiento 
se registraron como sigue: 5, 11, 9, 5, 10, 15, 6, 10, 
5 y 10. Trate los datos como una muestra aleatoria y 
calcule 

a) la media; 

b) la mediana; 

c) la moda. 


8.3 Los tiempos que los 9 individuos de una muestra 
aleatoria tardan en reaccionar ante un estimulante se 
registraron como 2.5, 3.6, 3.1, 4.3, 2.9, 2.3, 2.6, 4.1 y 
3.4 segundos. Calcule 

a) la media; 

b) la mediana. 


8.4 El número de multas emitidas por infracciones de 
tránsito por 8 oficiales estatales durante el fin de se- 
mana del día en Conmemoración de los Caídos es 5, 4, 
7,7, 6,3, 8 y 6. 

a) Si estos valores representan el número de multas 
emitidas por una muestra aleatoria de 8 oficiales 
estatales del condado de Montgomery, en Virginia, 
defina una población adecuada. 

b) Si los valores representan el número de multas 
emitidas por una muestra aleatoria de 8 oficiales 
estatales de Carolina del Sur, defina una población 
adecuada. 


8.5 El número de respuestas incorrectas en un exa- 
men de competencia de verdadero-falso para una 
muestra aleatoria de 15 estudiantes se registraron de la 
siguiente manera: 2, 1, 3, 0, 1, 3, 6, 0, 3, 3, 5, 2, 1,4 y 
2. Саїсше 

a) la media; 

b) la mediana; 

c) la moda. 


8.6 Calcule la media, la mediana y la moda para la 
muestra, cuyas observaciones, 15, 7, 8, 95, 19, 12, 8, 
22 y 14 representan el número de días de incapacidad 
médica reportados en 9 solicitudes de devolución de 
impuestos. ¿Qué valor parece ser la mejor medida del 
centro de esos datos? Explique las razones de su pre- 
ferencia. 


8.7 Una muestra aleatoria de empleados de una fá- 
brica local prometieron los siguientes donativos, en dó- 
lares, al United Fund: 100, 40, 75, 15, 20, 100, 75, 50, 
30, 10, 55, 75, 25, 50, 90, 80, 15, 25, 45 y 100. Calcule 
a) la media; 
b) la moda. 


8.8 De acuerdo con la escritora ecologista Jacqueline 
Killeen, los fosfatos que contienen los detergentes de 
uso casero pasan directamente a nuestros sistemas 
de desagiie, ocasionando que los lagos se conviertan 
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en pantanos, los cuales a la larga se volverán desiertos. 
Los siguientes datos muestran la cantidad de fosfatos 
por carga de lavado, en gramos, para una muestra alea- 
toria de diversos tipos de detergentes que se usan de 
acuerdo con las instrucciones prescritas: 


Detergente Fosfatos por carga 
para ropa (gramos) 
A &Р Blue Sail 

Dash 47 
Concentrated All 42 
Cold Water All 42 
Breeze 41 
Oxydol 34 
Ajax 31 
Sears 30 
Fab 29 
Cold Power 29 
Bold 29 
Rinso 26 


Para los datos de fosfato dados, calcule 
a) la media; 
b) la mediana; 
c) la moda. 


8.9 Considere los datos del ejercicio 8.2 y calcule 
a) el rango; 
b) la desviación estándar. 


8.10 Para la muestra de tiempos de reacción del ejer- 

cicio 8.3 calcule 

a) el rango; 

b) la varianza, utilizando la fórmula de la forma 
(8.2.1). 


8.11 Para los datos del ejercicio 8.5 calcule la va- 
rianza utilizando la fórmula 

a) de la forma (8.2.1); 

b) del teorema 8.1. 


8.12 El contenido de alquitrán de 8 marcas de cigarri- 
llos que se seleccionan al azar de la lista más reciente 
publicada por la Comisión Federal de Comercio es el 
siguiente: 7.3, 8.6, 10.4, 16.1, 12.2, 15.1, 14.5 y 9.3 
miligramos. Calcule 

a) la media; 

b) la varianza. 


8.13 Los promedios de calificaciones de 20 estudian- 
tes universitarios del último año, seleccionados al azar 
de una clase que se va a graduar, son los siguientes: 


32 19 27 24 2.8 
29 38 30 25 3.3 
18 25 3.7 28 2.0 
32 23 21 25. 19 


Calcule la desviación estándar. 
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8.14 a) Demuestre que la varianza de la muestra per- 
manece sin cambio si a cada valor de la muestra se le 
suma o se le resta una constante c. 
b) Demuestre que la varianza de la muestra se vuelve 
с? veces su valor original si cada observación de la 
muestra se multiplica por c. 


8.15 Verifique que la varianza de la muestra 4, 9, 3, 6, 
4 y 7 es 5.1, y utilice este hecho, junto con los resulta- 
dos del ejercicio 8.14, para calcular 
a) la varianza de la muestra 12, 27, 9, 18, 12 y 21; 
b) la varianza de la muestra 9, 14, 8, 11, 9 y 12. 


8.3 Distribuciones muestrales 
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8.16 Ер la temporada 2004-2005 el equipo de futbol 
americano de la Universidad del Sur de California tuvo 
las siguientes diferencias de puntuación en los 13 par- 
tidos que jugó. 


1149323638 38 308431536 
Calcule 


a) la media de la diferencia de puntos; 
b) la mediana de las diferencias de puntos. 


El campo de la inferencia estadística trata básicamente con generalizaciones y prediccio- 
nes. Por ejemplo, con base en las opiniones de varias personas entrevistadas en la calle, 
los estadounidenses podrían afirmar que en una próxima elección 60% de los votantes 
de la ciudad de Detroit favorecerían a cierto candidato. En este caso tratamos con una 
muestra aleatoria de opiniones de una población finita muy grande. Por otro lado, con 
base en las estimaciones de 3 contratistas seleccionados al azar, de los 30 que laboran 
actualmente en esta ciudad, podríamos afirmar que el costo promedio de construir una 
residencia en Charleston, Carolina del Sur, está entre $330,000 y $335,000. La pobla- 
ción que se va a muestrear aquí también es finita, pero muy pequeña. Finalmente, con- 
sideremos una máquina despachadora de bebida gaseosa que está diseñada para servir 
en promedio 240 mililitros de bebida. Un ejecutivo de la empresa calcula la media de 
40 bebidas servidas y obtiene x = 236 mililitros y, con base en este valor, decide que la 
máquina está sirviendo bebidas con un contenido promedio de и = 240 mililitros. Las 
40 bebidas servidas representan una muestra de la población infinita de posibles bebidas 


que despachará esta máquina. 


Inferencias sobre la población a partir de información de la muestra 


En cada uno de los ejemplos anteriores calculamos un estadístico de una muestra que se 
selecciona de la población, y con base en tales estadísticos hicimos varias afirmaciones 
respecto a los valores de los parámetros de la población, que pueden ser o no ciertas. 
El ejecutivo de la empresa decide que la máquina despachadora está sirviendo bebidas 
con un contenido promedio de 240 mililitros, aunque la media de la muestra fue de 236 
mililitros, porque conoce la teoría del muestreo según la cual, si y = 240 mililitros, tal 
valor de la muestra podría ocurrir fácilmente. De hecho, si realiza pruebas similares, 
cada hora por ejemplo, esperaría que los valores del estadístico х fluctuaran por arriba y 
por abajo de u = 240 mililitros. Sólo cuando el valor de x difiera considerablemente de 
240 mililitros el ejecutivo de la empresa tomará medidas para ajustar la máquina. 

Como un estadístico es una variable aleatoria que depende sólo de la muestra obser- 
vada, debe tener una distribución de probabilidad. 


Definición 8.5: La distribución de probabilidad de un estadístico se denomina distribución muestral. 


8.4 Distribución muestral de medias y el teorema del límite central 233 


La distribución muestral de un estadístico depende de la distribución de la pobla- 
ción, del tamaño de las muestras y del método de selección de las muestras. En lo que 
resta de este capítulo estudiaremos varias de las distribuciones muestrales más impor- 
tantes de los estadísticos que se utilizan con frecuencia. Las aplicaciones de tales distri- 
buciones muestrales a problemas de inferencia estadística se consideran en la mayoría 
de los capítulos posteriores. La distribución de probabilidad de Х ве llama distribución 
muestral de la media. 


¿Qué es la distribución muestral de X ? 


Se deberían considerar las distribuciones muestrales de Ху S? сото los mecanismos a 
partir de los cuales se puede hacer inferencias acerca de los parámetros u y о?. La dis- 
tribución muestral de Х con tamaño muestral n es la distribución que resulta cuando un 
experimento se lleva a cabo una y otra vez (siempre con una muestra de tamaño n) y 
resultan los diversos valores de X. Por lo tanto, esta distribución muestral describe la 
variabilidad de los promedios muestrales alrededor de la media de la población и. En el 
caso de la máquina despachadora de bebidas, el conocer la distribución muestral de Xle 
permite al analista encontrar una discrepancia “típica” entre un valor х observado y el 
verdadero valor de и. Se aplica el mismo principio en el caso de la distribución de $°. La 
distribución muestral produce información acerca de la variabilidad de los valores de s? 
alrededor de с? en experimentos que se repiten. 


8.4 Distribución muestral de medias y el teorema 
del límite central 


La primera distribución muestral importante a considerar es la de la media X. Suponga 
que de una población normal con media и y varianza о? se toma una muestra aleatoria 
de n observaciones. Cada observación X, i = 1, 2,..., п, de la muestra aleatoria ten- 
drá entonces la misma distribución normal que la población de donde se tomó. Así, por 
la propiedad reproductiva de la distribución normal que se estableció en el teorema 7.11, 
concluimos que 


= 1 
„ыы (Б ыы е 
tiene una distribución normal con media 
1 Р y ly a А а? 
„а. мдан быры во река бе 
— х__—— 


n términos п términos 


Si tomamos muestras de una población con distribución desconocida, ya sea finita 
o infinita, la distribución muestral de X aún será aproximadamente normal con media и 
y varianza 0?/n, siempre que el tamaño de la muestra sea grande. Este asombroso resul- 
tado es una consecuencia inmediata del siguiente teorema, que se conoce como teorema 
del límite central. 
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El teorema del límite central 


Teorema 8.2: 


Teorema del límite central: Si Х ез la media de una muestra aleatoria de tamaño л, 
tomada de una población con media и y varianza finita o°, entonces la forma límite de 
la distribución de 


Ta 
a 


a medida que n — oo, es la distribución normal estándar n(z; 0, 1). 


La aproximación normal para X por lo general será buena si n > 30, siempre y 
cuando la distribución de la población no sea muy asimétrica. Si n < 30, la aproxima- 
ción será buena sólo si la población no es muy diferente de una distribución normal y, 
como antes se estableció, si se sabe que la población es normal, la distribución muestral 
de X seguirá siendo una distribución normal exacta, sin importar qué tan pequeño sea el 
tamaño de las muestras. 

El tamaño de la muestra n = 30 es un lineamiento para el teorema del límite central. 
Sin embargo, como indica el planteamiento del teorema, la suposición de normalidad en la 
distribución de X se vuelve más precisa a medida que n se hace más grande. De hecho, 
la figura 8.1 ilustra cómo funciona el teorema. La figura indica cómo la distribución de 
X se acerca más a la normalidad a medida que aumenta n, empezando con la distribución 
claramente asimétrica de una observación individual (n = 1). También ilustra que la 
media de X sigue siendo и para cualquier tamaño de la muestra y que la varianza de X se 
vuelve más pequeña a medida que aumenta л. 


n grande (cerca de lo normal) 


n = 1 (población) 


п de pequeña a moderada 


ТШ 


Figura 8.1: Ejemplo del teorema del límite central (distribución de X рага п = 1, п mo- 
derada y n grande). 


Ejemplo 8.4: | Una empresa de material eléctrico fabrica bombillas que tienen una duración que se 


Solución: 


distribuye aproximadamente en forma normal, con media de 800 horas y desviación es- 

tándar de 40 horas. Calcule la probabilidad de que una muestra aleatoria de 16 bombillas 

tenga una vida promedio de menos de 775 horas. 

La distribución muestral de Х será aproximadamente normal, con и; = 800 y o; = 40/ 
16 = 10. La probabilidad que se desea es determinada por el área de la región 

sombreada de la figura 8.2. 
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En lo que corresponde a x = 775, obtenemos que 


Ох =10 


775 800 à 
Figura 8.2: Área para el ejemplo 8.4. 
715 — 800 
ї 10 r 
y, por lo tanto, 
Р(Х < 775) = P (Z <- 2.5) = 0.0062. J 


Inferencias sobre la media de la población 


Una aplicación muy importante del teorema del límite central consiste en determinar 
valores razonables de la media de la población u. Temas como prueba de hipótesis, 
estimación, control de calidad y muchos otros utilizan el teorema del límite central. El 
siguiente ejemplo ilustra cómo se utiliza el teorema del límite central con respecto a su 
relación con u, la media poblacional, aunque la aplicación formal de los temas preceden- 
tes se deja para capítulos posteriores. 

En el siguiente estudio de caso proporcionamos un ejemplo en el que se hace una 
inferencia utilizando la distribución muestral de X. En este ejemplo sencillo se conocen 
и y O. El teorema del límite central у el concepto general de las distribuciones muestrales 
a menudo se utilizan para proporcionar evidencias acerca de algún aspecto importante de 
una distribución, por ejemplo uno de sus parámetros. En el caso del teorema del límite 
central el parámetro que nos interesa es la media и. La inferencia que se hace acerca 
de u puede adoptar una de varias formas. Con frecuencia el analista desea que los datos 
(en la forma de x) respalden (o no) alguna conjetura predeterminada respecto al valor 
de u. El uso de lo que sabemos sobre la distribución de muestreo puede contribuir a 
responder este tipo de pregunta. En el siguiente estudio de caso el concepto de prueba 
de hipótesis conduce a un objetivo formal que destacaremos en capítulos posteriores. 


Estudio de caso 8.1: | Partes para automóviles. Un importante proceso de fabricación produce partes de com- 
ponentes cilíndricos para la industria automotriz. Es importante que el proceso produzca 
partes que tengan un diámetro medio de 5.0 milímetros. El ingeniero implicado asume 
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que la media de la población es de 5.0 milímetros. Se lleva a cabo un experimento donde 
se seleccionan al azar 100 partes elaboradas por el proceso y se mide el diámetro de cada 
una de ellas. Se sabe que la desviación estándar de la población es с = 0.1 milímetros. 
El experimento indica un diámetro promedio muestral de х = 5.027 milímetros. ¿Esta 
información de la muestra parece apoyar o refutar la suposición del ingeniero? 

Solución: Este ejemplo refleja el tipo de problemas que a menudo se presentan y que se resuelven 
con las herramientas de pruebas de hipótesis que se presentan en los siguientes capítulos. 
No utilizaremos aquí el formalismo asociado con la prueba de hipótesis, pero ilustrare- 
mos los principios y la lógica que se utilizan. 

El hecho de que los datos apoyen o refuten la suposición depende de la probabilidad 
de que datos similares a los que se obtuvieron en este experimento (x = 5.027) pueden 
ocurrir con facilidad cuando de hecho u = 5.0 (figura 8.3). En otras palabras, ¿qué tan 
probable es que se pueda obtener x > 5.027 con n = 100, si la media de la población es 
и = 5.0? Si esta probabilidad sugiere que х = 5.027 no es poco razonable, no se refuta 
la suposición. Si la probabilidad es muy baja, se puede argumentar con certidumbre que 
los datos no apoyan la suposición de que и = 5.0. La probabilidad que elegimos para el 
cálculo es dada por P(|X— 5| > 0.027). 

En otras palabras, si la media и es 5, ¿cuál es la probabilidad de que X se desvíe 


=_= 
4.973 5.0 5.027 


Figura 8.3: Área рага el estudio de caso 8.1. 


cuando mucho hasta 0.027 milímetros? 


P(|X – 5| > 0.027) = Р(Х – 5 > 0.027) + Р(Х – 5 < —0.027) 


Х —5 
=2P | == > 2/7 |. 
( 0.1/y100 ) 
Aquí simplemente лиш ш X de acuerdo con el teorema del límite central. Si 
la suposición u = 5.0 es cierta, 1 17 EVA debería ser N(0, 1). Por consiguiente, 


X – 
> 2.7 | = 2P (Z > 2.7) = 2(0.0035) = 0.007. 
(2 ле ) (Z >2Лу=2( ) 


Por lo tanto, se experimentaría por casualidad que una х estaría a 0.027 milímetros 
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de la media en tan sólo 7 de 1000 experimentos. Como resultado, este experimento con 
х = 5.027 ciertamente no ofrece evidencia que apoye la suposición de que и = 5.0. De 
hecho, ¡la refuta consistentemente! 


Ejemplo 8.5: ¡El viaje en un autobús especial para ir de un campus de una universidad al campus de 


Solución: 


Distribución 


otra en una ciudad toma, en promedio, 28 minutos, con una desviación estándar de 5 
minutos. En cierta semana un autobús hizo el viaje 40 veces. ¿Cuál es la probabilidad de 
que el tiempo promedio del viaje sea mayor a 30 minutos? Suponga que el tiempo pro- 
medio se redondea al entero más cercano. 

En este caso и = 28 y с = 3. Necesitamos calcular la probabilidad Р(Х > 30) con n = 
40. Como el tiempo se mide en una escala continua redondeada al minuto más cercano, 
una х mayor que 30 sería equivalente а х > 30.5. Por lo tanto, 


Х —28 Е 30.5 — 28 
5/40 5/v40 


Hay sólo una ligera probabilidad de que el tiempo promedio de un viaje del autobús 
exceda 30 minutos. En la figura 8.4 se presenta una gráfica ilustrativa. JJ 


P(X >30) =P ( ) = P(Z > 3.16) = 0.0008. 


28.0 30.5 


Figura 8.4: Área рага el ejemplo 8.5. 


muestral de la diferencia entre dos medias 


La ilustración del estudio de caso 8.1 se refiere a conceptos de inferencia estadística 
sobre una sola media и. El ingeniero estaba interesado en respaldar una suposición con 
respecto a una sola media de población. Una aplicación mucho más importante incluye 
dos poblaciones. Un científico o ingeniero se podrían interesar en un experimento donde 
se comparan dos métodos de producción: el 1 y el 2. La base para tal comparación es 
1, = и, la diferencia entre las medias de población. 

Suponga que tenemos dos poblaciones, la primera con media џи, y varianza о?, у 
la segunda con media u, у varianza 07. Representemos con el estadístico X; la media 
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de una muestra aleatoria de tamaño n,, seleccionada de la primera población, y con el 
estadístico X, la media de una muestra aleatoria de tamaño n, seleccionada de la segunda 
población, independiente de la muestra de la primera población. ¿Qué podríamos decir 
acerca de la distribución muestral de la diferencia Ху — Х para muestras repetidas de 
tamaños n, y n,? De acuerdo con el teorema 8.2, tanto la variable X como la variable 
Хь están distribuidas más o menos de forma normal con medias и, y u, y varianzas 
сї, у żin, respectivamente. Esta aproximación mejora a medida que aumentan n, y 
n,. Al elegir muestras independientes de las dos poblaciones nos aseguramos de ale las 
variables Х| y X2 sean independientes y, usando el teorema 7.11, con a, = 1 y a, = -1, 
concluimos que X; — X, se distribuye aproximadamente de forma normal con medi 


Их. = Их, = Их, = Ш = Ha 


y varianza 2 


2 
2 a 


0 


2 nı na 


El teorema del límite central se puede ampliar fácilmente al caso de dos muestras y dos 
poblaciones. 


Si se extraen al azar muestras independientes de tamaños nyn, de dos poblaciones, 
discretas o continuas, con medias и y и, y varianzas О у 03, respectivamente, entonces 
la distribución muestral de las es de las medias, Ху — X>, tiene una distribución 
aproximadamente normal, con media y varianza dadas por 


ГОТ Т аро 

H Ex = Шш Шо У Tx ni na 
еа. к ТО у ш 
Yom) + (03 /n2) 


es aproximadamente una variable normal estándar. 


Si tanto n, como n, son mayores o iguales que 30, la aproximación normal para la 
distribución de Ху – Хә es muy buena cuando las distribuciones subyacentes no están tan 
alejadas de la normal. Sin embargo, aun cuando n, y n, sean menores que 30, la aproxi- 
mación normal es hasta cierto punto buena, excepto cuando las poblaciones no son 
definitivamente normales. Por supuesto, si ambas poblaciones son normales, entonces 
Ху — X, tiene una distribución normal sin importar de qué tamaño sean n yn, 

La utilidad de la distribución muestral de la diferencia entre los dos promedios 
muestrales es muy similar a la que se describe en el estudio de caso 8.1 en la página 
235 para el caso de una sola media. Ahora presentaremos el estudio de caso 8.2, que se 
enfoca en el uso de la diferencia entre dos medias muestrales para respaldar (o no) la 
suposición de que dos medias de población son iguales. 


Estudio de caso 8.2: | Tiempo de secado de pinturas. Se llevan a cabo dos experimentos independientes en 


los que se comparan dos tipos diferentes de pintura, el A y el B. Con la pintura tipo A se 
pintan 18 especímenes y se registra el tiempo (en horas) que cada uno tarda en secar. Lo 
mismo se hace con la pintura tipo B. Se sabe que la desviación estándar de población de 
ambas es 1.0. 
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Si se supone que los especímenes pintados se secan en el mismo tiempo medio con 
los dos tipos de pintura, calcule P (X 4 —X g > 1.0), donde ХА y Хв son los tiempos 
promedio de secado para muestras de tamaño n, = п, = 18. 


Solución: A partir de la distribución de muestreo de Хд — Хр sabemos que la distribución es aproxi- 
madamente normal con media 


Их,-Х„ = Ha — Ив = 0 
y varianza 
2 2 1 1 
о? = Ср ва | 
NA NB 18 18 9 


ХА Хв 
ї 
1 
І 
П 
П 
| 
П 
1 
| 
П 
1 
[| 
П 
і 
І 
П 
1 
l 


Ша Hg =0 1.0 


Figura 8.5: Área para el estudio de caso 8.2. 


La probabilidad que se desea es dada por la región sombreada en la figura 8.5. En 
correspondencia con el valor X4 — Xg = 1.0, tenemos 


_1—(pa = Ив) 1—0 


7 = = = 3.0; 
\/1/9 \/1/9 
de modo que 
P(Z > 3.0) =1-—P(Z< 3.0) = 1 — 0.9987 = 0.0013. И | 


¿Qué aprendemos del estudio de caso 8.2? 


La mecánica en el cálculo se basa en la suposición de que u, = 4, Suponga, sin em- 
bargo, que el experimento realmente se lleva a cabo con el fin de hacer una inferencia 
respecto a la igualdad de y, y 4p los tiempos medios de secado de las dos poblaciones. 
Si se encontrara que los dos promedios difieren por una hora (o más), este resultado sería 
una evidencia que nos llevaría a concluir que el tiempo medio de secado de la población 
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no es igual para los dos tipos de pintura. Por otro lado, suponga que la diferencia en los 
dos promedios muestrales es tan pequeña como, digamos, 15 minutos. Si и, = Uy, 


Y Y X= 
Р(Х А -Х) > 025 or =P ( A в —0 3 


> 
1/9 4 


3 
=P (z > 3) = 1—Р(7 < 0.75) = 1 — 0.7734 = 0.2266. 


Como esta probabilidad no es baja, se concluiría que una diferencia de 15 minutos en las 
medias de las muestras puede ocurrir por azar, es decir, sucede con frecuencia aunque 
Ш, = и. Por lo tanto, este tipo de diferencia en el tiempo promedio de secado cierta- 
mente no es una señal clara de que и, F My. 

Como indicamos al principio, en los capítulos siguientes se observará un forma- 
lismo más detallado con respecto a éste y a otros tipos de inferencia estadística, por 
ejemplo, la prueba de hipótesis. El teorema del límite central y las distribuciones de 
muestreo que se presentan en las siguientes tres secciones también desempeñarán un 
papel fundamental. 


Ejemplo 8.6: | Los cinescopios para televisor del fabricante A tienen una duración media de 6.5 años y 


Solución: 


una desviación estándar de 0.9 años; mientras que los del fabricante B tienen una dura- 
ción media de 6.0 años y una desviación estándar de 0.8 años. ¿Cuál es la probabilidad 
de que una muestra aleatoria de 36 cinescopios del fabricante A tenga por lo menos 1 año 
más de vida media que una muestra de 49 cinescopios del fabricante B? 


Tenemos la siguiente información: 
Población 1 Población 2 
Шш = 6.5 Ш = 6.0 
сі = 0.9 o = 0.8 
ni = 36 п? = 49 


Si utilizamos el teorema 8.3, la distribución muestral de Х| – Х» será aproximada- 
mente normal y tendrá una media y una desviación estándar de 


0.81 0.64 


La probabilidad de que 36 cinescopios del fabricante A tengan рог lo menos 1 año 
más de vida media que 49 cinescopios del fabricante B es dada por el área de la región 
sombreada de la figura 8.6. Con respecto al valor х, — Х, = 1.0, encontramos que 


y de aquí 


Р(Х — X > 1.0) = P (Z > 2.65) = 1 — P (Z < 2.65) 
=1 — 0.9960 = 0.0040. J 


Ejercicios 
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Q = 0.189 


х= Хо 


0.5 1.0 


Figura 8.6: Área para el ejemplo 8.6. 


Más sobre la distribución muestral de medias. Aproximación normal 


a la distribución binomial 


En la sección 6.5 analizamos a fondo la aproximación normal a la distribución binomial. 
Estaban dadas las condiciones sobre los parámetros n y p, para los cuales la distribución 
de una variable aleatoria binomial se puede aproximar mediante la distribución normal. 
Los ejemplos y los ejercicios reflejaron la importancia del concepto de “aproximación 
normal”. Resulta que el teorema del límite central da más idea de cómo y por qué fun- 
ciona esta aproximación. Sabemos con certeza que una variable aleatoria binomial es el 
número X de éxitos en n pruebas independientes, donde el resultado de cada prueba es 
binario. En el capítulo 1 también vimos que la proporción calculada en un experimento 
así es un promedio de un conjunto de ceros y unos. De hecho, mientras que la proporción 
Х/п es un promedio, X es la suma de este conjunto de ceros y unos, y tanto X como X/n 
son casi normales si n es suficientemente grande. Desde luego, a partir de lo que apren- 
dimos en el capítulo 6, sabemos que hay condiciones de n y p que afectan la calidad de 


la aproximación; a saber, np > 5 y nq > 5. 


Ejercicios 


8.17 Si se extraen todas las muestras posibles de ta- 
maño 16 de una población normal con media igual a 50 
y desviación estándar igual a 5, ¿cuál es la probabilidad 
de que una media muestral X caiga en el intervalo que 
va de их — 1.90 a ug — 0.407? Suponga que las me- 
dias muestrales se pueden medir con cualquier grado 
de precisión. 


8.18 Si la desviación estándar de la media para la 
distribución muestral de muestras aleatorias de ta- 
maño 36 de una población grande o infinita es 2, ¿qué 
tan grande debe ser el tamaño de la muestra si la des- 
viación estándar se reduce a 1.2? 


8.19 Se fabrica cierto tipo de hilo con una resistencia a 
la tensión media de 78.3 kilogramos y una desviación 
estándar de 5.6 kilogramos. ¿Cómo cambia la varianza 
de la media muestral cuando el tamaño de la muestra 


a) aumenta de 64 a 196? 
b) disminuye de 784 a 49? 


8.20 Dada la población uniforme discreta 
І = 
re (E x = 2,4,6, 


en otro caso, 
calcule la probabilidad de que una muestra aleatoria de 
tamaño 54, seleccionada con reemplazo, produzca una 
media muestral mayor que 4.1 pero menor que 4.4. 
Suponga que las medias se miden al décimo más 
cercano. 


8.21 Una máquina de bebidas gaseosas se ajusta de 
manera que la cantidad de bebida que sirve promedie 
240 mililitros con una desviación estándar de 15 mi- 
lilitros. La máquina se verifica periódicamente to- 
mando una muestra de 40 bebidas y calculando el 
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contenido promedio. Si la media de las 40 bebidas 
es un valor dentro del intervalo ug +20 z, se piensa 
que la máquina opera satisfactoriamente; de lo con- 
trario, se ajusta. En la sección 8.3 el ejecutivo de la 
empresa encontró que la media de 40 bebidas era 
х = 236 mililitros y concluyó que la máquina no ne- 
cesitaba un ajuste. ¿Fue ésta una decisión razonable? 


8.22 Las estaturas de 1000 estudiantes se distribuyen 
aproximadamente de forma normal con una media de 
174.5 centímetros y una desviación estándar de 6.9 
centímetros. Si se extraen 200 muestras aleatorias de 
tamaño 25 de esta población y las medias se registran al 
décimo de centímetro más cercano, determine 
a) la media y la desviación estándar de la distribu- 
ción muestral de X ; 
b) el número de las medias muestrales que caen entre 
172.5 y 175.8 centímetros; 
c) el número de medias muestrales que caen por de- 
bajo de 172.0 centímetros. 


8.23 La variable aleatoria X, que representa el nú- 
mero de cerezas en un tarta, tiene la siguiente distribu- 
ción de probabilidad: 


х 4 5 6 7 
PŒ =x) [02 04 03 01 


a) Calcule la media и y la varianza о? de X. 

b) Calcule la media и y la varianza 0% de la media 
X para muestras aleatorias de 36 tartas de cereza. 

c) Calcule la probabilidad de que el número prome- 
dio de cerezas en 36 tartas sea menor que 5.5. 


8.24 Si cierta máquina fabrica resistencias eléctricas 
que tienen una resistencia media de 40 ohms y una des- 
viación estándar de 2 ohms, ¿cuál es la probabilidad de 
que una muestra aleatoria de 36 de estas resistencias 
tenga una resistencia combinada de más de 1458 ohms? 


8.25 La vida media de una máquina para elaborar pan 
es de 7 años, con una desviación estándar de 1 año. 
Suponga que la vida de estas máquinas sigue aproxi- 
madamente una distribución normal y calcule 
a) la probabilidad de que la vida media de una mues- 
tra aleatoria de 9 de estas máquinas caiga entre 6.4 
y 7.2 años; 
b) el valor de x a la derecha del cual caería 15% de 
las medias calculadas de muestras aleatorias de ta- 
maño 9. 


8.26 La cantidad de tiempo que le toma al cajero de 
un banco con servicio en el automóvil atender a un 
cliente es una variable aleatoria con una media и = 3.2 
minutos y una desviación estándar с = 1.6 minutos. Si 
se observa una muestra aleatoria de 64 clientes, calcule 
la probabilidad de que el tiempo medio que el cliente 
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pasa en la ventanilla del cajero sea 
a) alo sumo 2.7 minutos; 
b) más de 3.5 minutos; 
c) al menos 3.2 minutos pero menos de 3.4 minutos. 


8.27 En un proceso químico la cantidad de cierto tipo 
de impureza en el producto es difícil de controlar y por 
ello es una variable aleatoria. Se especula que la canti- 
dad media de la población de impurezas es 0.20 gramos 
por gramo del producto. Se sabe que la desviación están- 
dar es 0.1 gramos por gramo. Se realiza un experimento 
para entender mejor la especulación de que u = 0.2. El 
proceso se lleva a cabo 50 veces en un laboratorio y el 
promedio de la muestra x resulta ser 0.23 gramos por 
gramo. Comente sobre la especulación de que la can- 
tidad media de impurezas es 0.20 gramos por gramo. 
Utilice el teorema del límite central en su respuesta. 


8.28 Se toma una muestra aleatoria de tamaño 25 de 
una población normal que tiene una media de 80 y una 
desviación estándar de 5. Una segunda muestra alea- 
toria de tamaño 36 se toma de una población normal 
diferente que tiene una media de 75 y una desviación 
estándar de 3. Calcule la probabilidad de que la media 
muestral calculada de las 25 mediciones exceda la me- 
dia muestral calculada de las 36 mediciones por lo me- 
nos 3.4 pero menos de 5.9. Suponga que las diferencias 
de las medias se miden al décimo más cercano. 


8.29 La distribución de alturas de cierta raza de pe- 
rros terrier tiene una media de 72 centímetros y una 
desviación estándar de 10 centímetros; en tanto que la 
distribución de alturas de cierta raza de poodles tiene 
una media de 28 centímetros con una desviación están- 
dar de 5 centímetros. Suponga que las medias muestra- 
les se pueden medir con cualquier grado de precisión 
y calcule la probabilidad de que la media muestral de 
una muestra aleatoria de alturas de 64 terriers exceda 
la media muestral para una muestra aleatoria de alturas 
de 100 poodles a lo sumo 44.2 centímetros. 


8.30 La calificación promedio de los estudiantes de 
primer año en un examen de aptitudes en cierta uni- 
versidad es 540, con una desviación estándar de 50. 
Suponga que las medias se miden con cualquier grado 
de precisión. ¿Cuál es la probabilidad de que dos gru- 
pos seleccionados al azar, que constan de 32 y 50 estu- 
diantes, respectivamente, difieran en sus calificaciones 
promedio por 

a) más de 20 puntos? 

b) una cantidad entre 5 y 10 puntos? 


8.31 Considere el estudio de caso 8.2 de la página 
238. Suponga que en un experimento se utilizaron 18 


especímenes para cada tipo de pintura y que х, — 
la diferencia real en el tiempo medio de secado, resultó 


ser 1.0. 
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a) ¿Parecería ser un resultado razonable si los dos 
tiempos promedio de secado de las dos poblacio- 
nes realmente son iguales? Utilice el resultado que 
se obtuvo en el estudio de caso 8.2. 

b) Si alguien hiciera el experimento 10,000 veces bajo 
la condición de que и, = и, ¿en cuántos de esos 
10,000 experimentos habría una diferencia х =з» 
tan grande como 1.0 (o más grande)? 


8.32 Dos máquinas diferentes de llenado de cajas se 
utilizan para llenar cajas de cereal en una línea de ensam- 
ble. La medición fundamental en la que influyen estas 
máquinas es el peso del producto en las cajas. Los in- 
genieros están seguros de que la varianza en el peso 
del producto es 0? = 1 onza. Se realizan experimentos 
usando ambas máquinas con tamaños muestrales de 36 
cada una. Los promedios muestrales para las máquinas 
A y B son x, = 4.5 onzas y Х„ = 4.7 onzas. Los ingenie- 
ros se sorprenden de que los dos promedios maestrales 
para las máquinas de llenado sean tan diferentes. 

a) Utilice el teorema del límite central para determinar 


Р(Хв —Х >0.2) 


bajo la condición de que u, = и. 

b) ¿Los experimentos mencionados parecen, de cual- 
quier forma, apoyar consistentemente la suposi- 
ción de que las medias de población de las dos 
máquinas son diferentes? Explique utilizando la 
respuesta que encontró en el inciso a. 


8.33 El benceno es una sustancia química altamente 
tóxica para los seres humanos. Sin embargo, se utiliza 
en la fabricación de medicamentos, de tintes y de recu- 
brimientos, así como en la peletería. Las regulaciones 
del gobierno establecen que el contenido de benceno en 
el agua que resulte de cualquier proceso de producción 
en el que participe esta sustancia no debe exceder 7950 
partes por millón (ppm). Para un proceso particular de 
interés, un fabricante recolectó una muestra de agua 25 
veces de manera aleatoria y el promedio muestral x fue 
de 7960 ppm. A partir de los datos históricos, se sabe 
que la desviación estándar ø es 100 ppm. 

a) ¿Cuál es la probabilidad de que el promedio mues- 
tral en este experimento exceda el límite estable- 
cido por el gobierno, si la media de la población es 
igual al límite? Utilice el teorema del límite central. 

b) ¿La x = 7960 observada en este experimento es 
firme evidencia de que la media de la población 
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en este proceso excede el límite impuesto por el 
gobierno? Responda calculando 


Р(Х > 7960 | и = 7950). 


Suponga que la distribución de la concentración 
de benceno es normal. 


8.34 En la fabricación de cierto producto de acero se 
están utilizando dos aleaciones, la A y la B. Se necesita 
diseñar un experimento para comparar las dos aleacio- 
nes en términos de su capacidad de carga máxima en 
toneladas, es decir, la cantidad máxima de carga que 
pueden soportar sin romperse. Se sabe que las dos des- 
viaciones estándar de la capacidad de carga son iguales 
a 5 toneladas cada una. Se realiza un experimento en el 
que se prueban 30 especímenes de cada aleación (A y 
B) y se obtienen los siguientes resultados: 


NA 49.5, Xp = 45.5; 


Los fabricantes de la aleación A están convencidos de 
que esta evidencia demuestra de forma concluyente que 
и, > и, y, por lo tanto, que su aleación es mejor. Los 
fabricantes de la aleación B afirman que el experimento 
fácilmente podría haber resultado х р 4, incluso 
si las dos medias de población fueran iguales. En otras 
palabras, “¡los resultados no son concluyentes!”. 
a) Encuentre un argumento que ponga en evidencia 
el error de los fabricantes de la aleación B. Para 
ello calcule 


P(Xa —Хв >4 | pa = ив). 


b) ¿Considera que estos datos apoyan fuertemente a 
la aleación A? 


ХА = Хв = 4. 


8.35 Considere la situación del ejemplo 8.4 de la 
página 234. ¿Los resultados que se obtuvieron allí lo 
llevan a cuestionar la premisa de que u = 800 horas? 
Proporcione un resultado probabilístico que indique 
qué tan raro es el evento X < 775 cuando u = 800. 
Por otro lado, ¿qué tan raro sería si и fuera, verdadera- 
mente, digamos, + 760 horas? 


8.36 Sea X, X,..... X, una muestra aleatoria de una 
distribución que sólo puede adoptar valores positivos. 
Utilice el teorema del límite central para argumen- 
tar que si n es tan grande como se requiere, entonces 
Y = X X,... X, tiene aproximadamente una distribución 
logarítmica normal. 


En la sección anterior aprendimos acerca de la distribución muestral de X. El teorema del 
límite central nos permitió utilizar el hecho de que 


X -u 


g/yn 


244 


Teorema 8.4: 


Capítulo 8 Distribuciones de muestreo fundamentales y descripciones de datos 


tiende a N(0, 1) a medida que crece el tamaño de la muestra. Las distribuciones mues- 
trales de estadísticos importantes nos permiten conocer información sobre los paráme- 
tros. Por lo general, los parámetros son las contrapartes del estadístico en cuestión. Por 
ejemplo, si un ingeniero se interesa en la resistencia media de la población de cierto tipo 
de resistencia, sacará provecho de la distribución muestral de X una vez que reúna la 
información de la muestra. Por otro lado, si está estudiando la variabilidad en la resis- 
tencia, evidentemente utilizará la distribución muestral de $? para conocer la contraparte 
paramétrica, la varianza de la población o°. 

Si se extrae una muestra aleatoria de tamaño п de una población normal con media 
и y varianza 0?, y se calcula la varianza muestral, se obtiene un valor del estadístico 52. 
Procederemos a considerar la distribución del estadístico (n — 1)5 2/0. 

Mediante la suma y la resta de la media muestral Xes fácil ver que 


п 


У: py? = УПО: -X) + (X – р 


{=1 ї=1 


= Y X -XP +Y X -W +200 -WY (AX) 


i=l i=1 i=1 
=X X-XV +m(X – p’. 
i=l 


Al dividir cada término de la igualdad entre с? y sustituir (п — 1)8? por У1(Х;—Х Y, 
obtenemos і=1 


У ур CDE E 0? 
а? 1 == . 


a o? 0? /n 


Ahora, de acuerdo con el corolario 7.1 de la página 222, sabemos que 


п 


(Xi = py? 
D = 


ї=1 


es una variable aleatoria chi cuadrada соп n grados de libertad. Tenemos una variable alea- 
toria chi cuadrada con n grados de libertad dividida en dos componentes. Observe que en la 
sección 6.7 demostramos que una distribución chi cuadrada es un caso especial de la distri- 
bución gamma. El segundo término del lado derecho es Z?, que es una variable aleatoria 
chi cuadrada con 1 grado de libertad, y resulta que (п — 1)8?%/0? es una variable 
aleatoria chi cuadrada con n — 1 grados de libertad. Formalizamos esto en el siguiente 
teorema. 


Si S° es la varianza de una muestra aleatoria de tamaño п que se toma de una población 
normal que tiene la varianza o°, entonces el estadístico 


2 _ (п1—1)8?° H(X¡-XY 
А A с 


tiene una distribución chi cuadrada con v = n — 1 grados de libertad. 


8.5 Distribución muestral de 52 245 


Los valores de la variable aleatoria x? se calculan de cada muestra mediante 
la fórmula 
2 (п— 1)52 
o? ` 
La probabilidad de que una muestra aleatoria produzca un valor x? mayor que algún 
valor específico es igual al área bajo la curva a la derecha de este valor. El valor x? por 


arriba del cual se encuentra un área de а por lo general se representa con Ж. Esto se 
ilustra mediante la región sombreada de la figura 8.7. 


=% 


: д 


Figura 8.7: La distribución chi cuadrada. 


La tabla A.5 da los valores de 2 para diversos valores de оу v. Las áreas, а, son los 
encabezados de las columnas; los grados de libertad, v, se dan en la columna izquierda, 
y las entradas de la tabla son los valores X. En consecuencia, el valor X con 7 grados 
de libertad, que deja un área de 0.05 a la derecha, es Хо; = 14.067. Debido a la falta de 
simetría, para encontrar Х095 = 2.167 рага v = 7 también debemos usar las tablas. 

Exactamente 95% de una distribución chi cuadrada cae entre X¿975 Y Жоо. Un 
valor x? que cae a la derecha de Kois no tiene probabilidades de ocurrir, a menos que 
el valor de с? que supusimos sea demasiado pequeño. Lo mismo sucede con un valor x? 
que cae a la izquierda de Хо el cual tampoco es probable que ocurra, a menos que 
el valor de о? que supusimos sea demasiado grande. En otras palabras, es posible tener 
un valor x? a la izquierda de Хө» o a la derecha de Xĝ 5 cuando el valor de с? es 
correcto; pero si esto sucediera, lo más probable es que el valor de о? que se supuso sea 
un error. 


Ejemplo 8.7: | Un fabricante de baterías para automóvil garantiza que su producto durará, en promedio, 


Solución: 


3 años con una desviación estándar de 1 año. Si cinco de estas baterías tienen duraciones 
de 1.9, 2.4, 3.0, 3.5 y 4.2 años, ¿el fabricante continuará convencido de que sus baterías 
tienen una desviación estándar de 1 año? Suponga que las duraciones de las baterías si- 
guen una distribución normal. 

Primero se calcula la varianza de la muestra usando el teorema 8.1, 


2 _ (5)(48.26) — (15)? 
Е (5)(4) 


2 (4)00.815) — 
Кет = 


= 0.815. 


Entonces, 
3.26 
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es un valor de una distribución chi cuadrada con 4 grados de libertad. Como 95% de los 
valores x? con 4 grados de libertad cae entre 0.484 y 11.143, el valor calculado con 
т? = 1 es razonable y, por lo tanto, el fabricante по tiene razones para sospechar que la 
desviación estándar no sea igual a 1 año. 


Grados de libertad como una medición de la información muestral 


Del corolario 7.1 expuesto en la sección 7.3 recuerde que 


п 


(X; — py? 
ar 


і=1 
tiene una distribución x? соп п grados de libertad. Observe también el teorema 8.4, el 
cual indica que la variable aleatoria 

O ы 


o? í o? 
i=l 


tiene una distribución x? con n – 1 grados de libertad. El lector debe también recordar 
que el término grados de libertad, que se utiliza en este contexto idéntico, se estudió en 
el capítulo 1. 

Como antes indicamos, el teorema 8.4 no se demostrará; sin embargo, el lector 
puede verlo como una indicación de que cuando no se conoce и y se considera la distri- 


bución de А 


(Xx, -X y 
= 


і=1 


hay 1 grado menos de libertad, o se pierde un grado de libertad al estimar и (es decir, 
cuando и se reemplaza por х). En otras palabras, en la muestra aleatoria de la distribu- 
ción normal hay n grados de libertad o partes de información independientes. Cuando 
los datos (los valores en la muestra) se utilizan para calcular la media, hay un grado 
menos de libertad en la información que se utiliza para estimar o°. 


8.6 Distribución t 


En la sección 8.4 se analizó la utilidad del teorema del límite central. Sus aplicaciones gi- 
ran en torno a las inferencias sobre una media de la población o a la diferencia entre dos 
medias de población. En este contexto es evidente la utilidad de utilizar el teorema del 
límite central y la distribución normal. Sin embargo, se supuso que se conoce la desvia- 
ción estándar de la población. Esta suposición quizá sea razonable en situaciones en las 
que el ingeniero está muy familiarizado con el sistema o proceso. Sin embargo, en mu- 
chos escenarios experimentales el conocimiento de с no es ciertamente más razonable 
que el conocimiento de la media de la población и. A menudo, de hecho, una estimación 
de ø debe ser proporcionada рог la misma información muestral que produce el prome- 
dio muestral x. Como resultado, un estadístico natural a considerar para tratar con las 
inferencias sobre u es 

-X-H 


r= ST 
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Teorema 8.5: 


247 


dado que S es el análogo de la muestra рага с. Si el tamaño de la muestra es pequeño, 
los valores de 5° fluctúan de forma considerable de una muestra a otra (véase el ejercicio 
8.43 de la página 259) y la distribución de Т se desvía de forma apreciable de la de una 
distribución normal estándar. 

Si el tamaño de la muestra es suficientemente grande, digamos n > 30, la distribu- 
ción de T no difiere mucho de la normal estándar. Sin embargo, para n < 30 es útil tratar 
con la distribución exacta de T. Para desarrollar la distribución muestral de 7, supon- 
dremos que nuestra muestra aleatoria se seleccionó de una población normal. Podemos 
escribir, entonces, 


r- Š -Bom ___7 
VSZ /а? „Мп = 1)" 
donde _ š Л 


-oj 
tiene una distribución normal estándar y 


(п = 1)S? 

V= a 
с 

tiene una distribución chi cuadrada соп у = п – 1 grados de libertad. Al obtener muestras 
de poblaciones normales se puede demostrar que X y $? son independientes y, en con- 
secuencia, también lo son Z y V. El siguiente teorema proporciona la definición de una 
variable aleatoria Т como una función de Z (normal estándar) y x?. Para completar se 
proporciona la función de densidad de la distribución t. 


Sea Z una variable aleatoria normal estándar y V una variable aleatoria chi cuadrada con 
v grados de libertad. Si Z y V son independientes, entonces la distribución de la variable 
aleatoria Т, donde 7 


УУ’ 


es dada por la función de densidad 


Г + 0/2] с 
а e ‚  —= 00 <1< оо. 


Ésta se conoce сото Іа distribución £ соп у grados de libertad. 


A partir de lo antes expuesto, y del teorema anterior, se deriva el siguiente corolario. 
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Corolario 8.1: Sean X,, Х,,..., X, variables aleatorias independientes normales con media и y desvia- 


ción estándar с. Sea 


= у у с е. 
ї= е1 


Entonces la variable aleatoria F tiene una distribución ѓ con v = n — 1 grados de li- 
bertad. 


La distribución de probabilidad de T se publicó por primera vez en 1908 en un ar- 
tículo de W. S. Gosset. En esa época, Gosset trabajaba para una cervecería irlandesa que 
prohibía a sus empleados que publicaran los resultados de sus investigaciones. Para evadir 
la prohibición Gosset publicó su trabajo en secreto bajo el seudónimo de “Student”. Es 
por esto que a la distribución de T se le suele llamar distribución г de Student o simple- 
mente distribución f. Para derivar la ecuación de esta distribución Gosset supuso que las 
muestras se seleccionaban de una población normal. Aunque ésta parecería una suposi- 
ción muy restrictiva, se puede demostrar que las poblaciones que no son normales y que 
poseen distribuciones en forma casi de campana aún proporcionan valores de Т que se 
aproximan muy de cerca a la distribución t. 


¿Qué apariencia tiene la distribución t? 


La distribución de T se parece a la distribución de Z en que ambas son simétricas al- 
rededor de una media de cero. Ambas distribuciones tienen forma de campana, pero 
la distribución ѓ es más variable debido al hecho de que los valores T dependen de las 
fluctuaciones de dos cantidades, X y S?; mientras que los valores Z dependen sólo de 
los cambios en X de una muestra a otra. La distribución de T difiere de la de Z en que la 
varianza de T depende del tamaño de la muestra n y siempre es mayor que 1. Sólo cuando 
el tamaño de la muestra n — oo las dos distribuciones serán iguales. En la figura 8.8 
se presenta la relación entre una distribución normal estándar (v = оо) y las distribucio- 
nes £ con 2 y 5 grados de libertad. Los puntos porcentuales de la distribución f se dan en 
la tabla A.4. 


—— 1  >zhuUIBPQ.Pe—e—Q«Q<.áúq AA HA 


—2 


Figura 8.8: Curvas de la distribución t para 


v=2,5y00. 


1 


0 1 2 E=.==f 0 ta 


Figura 8.9: Propiedad de simetría (alrededor 
de 0) de la distribución /. 
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El valor t por arriba del cual se encuentra un área igual a œ por lo general se re- 
presenta con г. Por consiguiente, el valor £ con 10 grados de libertad que deja una área 
de 0.025 a la derecha es £ = 2.228. Como la distribución г es simétrica alrededor de 
una media de cero, tenemos 1, _,,=—1,; es decir, el valor ѓ que deja una área de 1 — aa 
la derecha y, por lo tanto, una área de с а la izquierda es igual al valor t negativo que deja 
una área de с en la cola derecha de la distribución (véase la figura 8.9). Esto es 


= Logo = = р еїсёїега. 


* 1095 


Ejemplo 8.8: | El valor £ con у = 14 grados de libertad que deja una área de 0.025 a la izquierda y, por 
lo tanto, una área de 0.975 a la derecha, es 


10.975 = —10.025 = —2.145. 3 


Ejemplo 8.9: | Calcule Р (10025 < T < toos). 


Solución: Como t, ,, deja una área de 0.05 a la derecha y —£, o5 


da, obtenemos una área total de 


deja una área de 0.025 a la izquier- 


1 — 0.05 — 0.025 = 0.925 


entre — En consecuencia, 


0.025 y 105 Ў 


P(—to0s < T <toos ) = 0.925. 3 


Ejemplo 8.10: | Calcule k tal queP(k < T < —1.761) = 0.045 para una muestra aleatoria de tamaño 
15 que se selecciona de una distribución normal y To 


0.045 А 


k —to.005 0 


Figura 8.10: Valores £ para el ejemplo 8.10. 


Solución: A partir de la tabla A.4 advertimos que 1.761 corresponde a t, ,, cuando у = 14. Por lo 


tanto, —£, o, = 1.761. Puesto que en el enunciado de probabilidad original К está a la 
izquierda de —£, ,, = -1.761, tenemos que k = —1, Entonces, a partir de la figura 8.10, 
tenemos 


0.045 = 0.05 — a, о а = 0.005. 
Así, de la tabla A.4 con v = 14, 


k = —to0.005 = —2.977 y P(-2.977 < T < —1.761) = 0.045. J 
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Exactamente 95% de los valores de una distribución f£ con v = n — 1 grados de li- 
bertad caen entre —£, o5 Y toy Por supuesto, hay otros valores 1 que contienen 95% de la 
distribución, como —, ,, y г, оз Pero estos valores no aparecen en la tabla A.4 y, además, 
el intervalo más corto posible se obtiene eligiendo valores f que dejen exactamente la 
misma área en las dos colas de nuestra distribución. Un valor t que caiga por debajo de 
=t 0,5 O рог arriba de 1, ,,, tendería a hacernos creer que ha ocurrido un evento muy raro, 
о que quizá nuestra suposición acerca de u es un error. Si esto ocurriera, tendríamos que 
tomar la decisión de que el valor de и que supusimos es erróneo. De hecho, un valor t que 
cae por debajo de —t p, о por arriba de í, p, proporcionaría incluso evidencia más sólida 
de que el valor de и que supusimos es muy improbable. En el capítulo 10 se tratarán 
procedimientos generales para probar aseveraciones respecto al valor del parámetro u. El 


siguiente ejemplo ilustra una vista preliminar del fundamento de tales procedimientos. 


Ejemplo 8.11: Un ingeniero químico afirma que el rendimiento medio de la población de un cierto 


Solución: 


proceso de lotes es 500 gramos por mililitro de materia prima. Para verificar dicha afir- 
mación muestrea 25 lotes cada mes. Si el valor г calculado cae entre —, os y fgos, queda 
satisfecho con su afirmación. ¿Qué conclusión debería sacar de una muestra que tiene 
una media x = 518 gramos por mililitro y una desviación estándar muestral s = 40 gra- 
mos? Suponga que la distribución de rendimientos es aproximadamente normal. 

En la tabla A.4 encontramos que f p, = 1.711 para 24 grados de libertad. Por lo tanto, el 
ingeniero quedará satisfecho con esta afirmación si una muestra de 25 lotes rinde un 


valor t entre —1.711 y 1.711. Si u = 500, entonces, 
_ 518 — 500 


SET 


un valor muy superior a 1.711. La probabilidad de obtener un valor t, con v = 24, igual 
o mayor que 2.25, es aproximadamente 0.02. Si u > 500, el valor de т calculado de la 
muestra sería más razonable. Por lo tanto, es probable que el ingeniero concluya que el 
proceso produce un mejor producto del que pensaba. 


2.23, 


¿Para qué se utiliza la distribución £? 


La distribución £ se usa ampliamente en problemas relacionados con inferencias acerca 
de la media de la población (como se ilustra en el ejemplo 8.11) o en problemas que 
implican muestras comparativas (es decir, en casos donde se trata de determinar si las 
medias de dos muestras son muy diferentes). El uso de la distribución se ampliará en 
los capítulos 9, 10, 11 y 12. El lector debería notar que el uso de la distribución t рага 
el estadístico - 
X -p 


ora 


requiere que Х,, Х,,..., X, sean normales. El uso de la distribución г y la consideración 
del tamaño de la muestra no se relacionan con el teorema del límite central. El uso de 
la distribución normal estándar en vez de T para n > 30 sólo implica, en este caso, que S 
es un estimador suficientemente bueno de с. En los siguientes capítulos la distribución 
t se usa con amplitud. 


T 
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8.7 Distribución F 


Recomendamos la distribución Т en parte por su aplicación a problemas en los que hay 
muestreo comparativo, es decir, a problemas en que se tienen que comparar dos medias 
muestrales. Por ejemplo, algunos de los ejemplos que daremos en los siguientes capí- 
tulos adoptarán un método aún más formal; un ingeniero químico reúne datos de dos 
catalizadores, un biólogo recoge datos sobre dos medios de crecimiento o un químico 
reúne datos sobre dos métodos de recubrimiento de material para prevenir la corrosión. 
Si bien es importante que la información muestral aclare lo relacionado con dos medias 
de población, a menudo éste es el caso en el que comparar la variabilidad es igual de 
importante, 51 no es que más. La distribución F tiene una amplia aplicación en la com- 
paración de varianzas muestrales y también es aplicable en problemas que implican dos 
o más muestras. 

El estadístico F se define como el cociente de dos variables aleatorias chi cuadrada 
independientes, dividida cada una entre su número de grados de libertad. En consecuen- 
cia, podemos escribir 

U / vi 
F == 


Е V/v , 


donde U y V son variables aleatorias independientes que tienen distribuciones chi cua- 
drada con v, y v, grados de libertad, respectivamente. Estableceremos ahora la distribu- 
ción muestral de F. 


Teorema 8.6: Sean U y V dos variables aleatorias independientes que tienen distribuciones chi cuadra- 
da con v, y v, grados de libertad, respectivamente. Entonces, la distribución de la varia- 


ble aleatoria F = r es dada por la función de densidad 
2 


Ti +v2)/21041 /12)1/? PAE 
АФ) = Гут /2)Г( у? /2) ENE ADN > 


0, е0 


Ésta se conoce сото Іа distribución F con v, y v, grados de libertad (g.1.). 


En capítulos posteriores utilizaremos ampliamente la variable aleatoria F. Sin embargo, 
no emplearemos la función de densidad, la cual sólo se dará como complemento. La 
curva de la distribución F no sólo depende de los dos parámetros v, y v, sino también del 
orden en el que se establecen. Una vez que tenemos estos dos valores, podemos identifi- 
car la curva. En la figura 8.11 se presentan distribuciones F típicas. 

Sea f, el valor f por arriba del cual encontramos un área igual a а. Esto se ilustra 
mediante la región sombreada de la figura 8.12. La tabla А.б proporciona valores de ў, 
sólo para а = 0.05 уа = 0.01 para varias combinaciones de los grados de libertad у, 
y v, Por lo tanto, el valor f con 6 y 10 grados de libertad, que deja un área de 0.05 a la 
derecha, es ў; = 3.22. Por medio del siguiente teorema, la tabla А.б también se puede 


utilizar para encontrar valores de f У Лу. La demostración se deja al lector. 
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d.f. = (6, 10) 


0 fa 


Figura 8.11: Distribuciones F típicas. Figura 8.12: Ilustración de la f, para la 
distribución F. 


Teorema 8.7: Al escribir f, (у, v,) para f, con v, y v, grados de libertad, obtenemos 


1 


Fi-a(v1,v2) == О, 


Por consiguiente, el valor f con 6 y 10 grados de libertad, que deja una área de 0.95 a la 
derecha, es 


1 1 


= = 0.246. 
fo.os(10,6) 4.06 


Fo.9s(6, 10) = 


La distribución F con dos varianzas muestrales 


Suponga que las muestras aleatorias de tamaños n, y n, se seleccionan de dos poblacio- 
nes normales con varianzas с? y 07, respectivamente. Del teorema 8.4, sabemos que 


(по — 1085 


05 


91 
son variables aleatorias que tienen distribuciones chi cuadrada con v,=n,—1yv,=n, 
— 1 grados de libertad. Además, como las muestras se seleccionan al azar, tratamos con 
variables aleatorias independientes. Entonces, usando el teorema 8.6 con х? = Оу хз 
= V, obtenemos el siguiente resultado. 


Teorema 8.8: Si S? у 52 son las varianzas de muestras aleatorias independientes de tamaño луп, 
tomadas de poblaciones normales con varianzas с? y 07, respectivamente, entonces, 


2 202 
_Si¡/o0í _ 038; 
S сокон = R 

55/05 9155 


tiene una distribución F соп у = n,- y v, = п, – 1 grados de libertad. 
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¿Para qué se utiliza la distribución F? 


Al inicio de esta sección contestamos esta pregunta parcialmente. La distribución F se 
usa en situaciones de dos muestras para hacer inferencias acerca de las varianzas de po- 
blación, lo cual implica aplicar el teorema 8.8. Sin embargo, la distribución F también se 
puede aplicar a muchos otros tipos de problemas que involucren varianzas muestrales. 
De hecho, la distribución F se llama distribución de razón de varianzas. Como ejemplo, 
considere el estudio de caso 8.2 en el que se compararon las dos pinturas, A y B, en 
relación con el tiempo medio que tardan en secar, en donde la distribución normal se 
aplica muy bien (suponiendo que se conocen с, y т„). Sin embargo, suponga que nece- 
sitamos comparar tres tipos de pinturas, digamos A, B y C, y que queremos determinar si 
las medias de población son equivalentes. Suponga que un resumen de la información 
importante del experimento es el siguiente: 


Pintura Media muestral Varianza muestral Tamaño muestral 


A ХА =45 sł =0.20 10 
В Xp = 5:5 52 = 0.14 10 
С Xc = 6.5 о 0 10 


El problema se centra alrededor de si los promedios muestrales (X,, X,, Xo) están о 
no suficientemente alejados. La implicación de “suficientemente alejados” resulta muy 
importante. Parecería razonable que si la variabilidad entre los promedios muestrales es 
mayor que lo que se esperaría por casualidad, los datos no apoyan la conclusión de que 
и, = lp = Meo Si estos promedios muestrales pudieran ocurrir por casualidad depende de 
la variabilidad dentro de las muestras, cuando se cuantifican por medio de 52, 52 y 52. 
La idea de los componentes importantes de la variabilidad se observa mejor utilizando 
algunas gráficas sencillas. Considere la gráfica de los datos brutos de las muestras A, B 
y C que se presenta en la figura 8.13. Estos datos podrían generar con facilidad la infor- 
mación antes resumida. 


A AAAAA ABAAB ABBBBB ВВССВ cece CCCG 
4.5 5.5 6.5 
Т Т Т 
X X XxX 


A B с 


Figura 8.13: Datos de tres muestras diferentes. 


Parece evidente que los datos provienen de distribuciones con diferentes medias de 
población, aunque hay cierto traslape entre las muestras. Un análisis que incluya todos 
los datos intentaría determinar si la variabilidad entre los promedios muestrales y la va- 
riabilidad dentro de las muestras podría haber ocurrido conjuntamente si, de hecho, las 
poblaciones tienen una media común. Observe que la clave para este análisis se centra 
alrededor de las dos siguientes fuentes de variabilidad. 


1. Variabilidad dentro de las muestras (entre observaciones en muestras distintas). 
2. Variabilidad entre muestras (entre promedios muestrales). 


Es evidente que si la variabilidad en 1) es considerablemente mayor que en 2), entonces 
habrá un traslape considerable en los datos muestrales, una señal de que los datos po- 
drían provenir de una distribución común. En el conjunto de datos que se presenta en la 
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figura 8.14 se encuentra un ejemplo. Por otro lado, es muy improbable que los datos de 
una distribución con una media común puedan tener una variabilidad entre promedios 
muestrales que sea considerablemente mayor que la variabilidad dentro de las muestras. 


A В.С А СВ АС САВ С АСВА ВАВАВСАСВВАВСС 
тт т 
ХА хс XB 


Figura 8.14: Datos que con facilidad podrían provenir de la misma población. 


Las fuentes de variabilidad en 1) y 2) generan importantes cocientes de varian- 
zas muestrales y los cocientes se utilizan junto con la distribución F. El procedimiento 
general implicado se llama análisis de varianza. Es interesante que en el ejemplo de 
la pintura aquí descrito tratamos con inferencias sobre tres medias de población pero 
utilizamos dos fuentes de variabilidad. No proporcionaremos detalles aquí, pero en los 
capítulos 13, 14 y 15 utilizaremos ampliamente el análisis de varianza en donde, por 
supuesto, la distribución F desempeña un papel importante. 


8.8 Gráficas de cuantiles y de probabilidad 


En el capítulo 1 presentamos al lector las distribuciones empíricas. El objetivo es utilizar 
presentaciones creativas para extraer información acerca de las propiedades de un conjunto 
de datos. Por ejemplo, los diagramas de tallo y hojas brindan al observador una imagen de 
la simetría y de otras propiedades de los datos. En este capítulo tratamos con muestras que, 
por supuesto, son conjuntos de datos experimentales de los que sacamos conclusiones so- 
bre las poblaciones. A menudo, la apariencia de la muestra proporciona información sobre 
la distribución de la que se tomaron los datos. Por ejemplo, en el capítulo 1 ilustramos la 
naturaleza general de pares de muestras con gráficas de puntos que presentan una compa- 
ración relativa entre la tendencia central y la variabilidad de dos muestras. 

En los capítulos siguientes con frecuencia supondremos que una distribución es nor- 
mal. La información gráfica respecto a la validez de esta suposición se puede obtener a 
partir de presentaciones como los diagramas de tallo y hojas y los histogramas de frecuen- 
cias. Además, en esta sección presentaremos los conceptos de gráficas de probabilidad 
normal y gráficas de cuantiles. Estas gráficas se utilizan en estudios con diversos grados 
de complejidad con el principal objetivo de que las gráficas proporcionen una verificación 
diagnóstica sobre la suposición de que los datos provienen de una distribución normal. 

Podemos caracterizar el análisis estadístico como el proceso de sacar conclusiones 
acerca de los sistemas en presencia de la variabilidad del sistema. Por ejemplo, el intento 
de un ingeniero por aprender acerca de un proceso químico a menudo es obstaculizado 
por la variabilidad del proceso. Un estudio que implica el número de artículos defec- 
tuosos en un proceso de producción con frecuencia se dificulta por la variabilidad en 
el método con el que se fabrican. En las secciones anteriores aprendimos acerca de las 
muestras y los estadísticos que expresan el centro de localización y la variabilidad en 
la muestra. Tales estadísticos ofrecen medidas simples, en tanto que una presentación 
gráfica brinda información adicional por medio de una imagen. 

Un tipo de gráfica que puede ser especialmente útil para revelar la naturaleza de un 
conjunto de datos es la gráfica de cuantiles. Igual que en el caso de la gráfica de caja 
y extensión (véase la sección 1.6), en el que el objetivo del analista es hacer distinciones, 
en la gráfica de cuantiles se pueden utilizar las ideas básicas para comparar muestras de 
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datos. En los siguientes capítulos se presentarán más ejemplos del uso de las gráficas de 
cuantiles, en los que se analizará la inferencia estadística formal asociada con la com- 
paración de muestras. En su momento, los estudios de caso mostrarán al lector tanto la 
inferencia formal como las gráficas diagnósticas para el mismo conjunto de datos. 


Gráfica de cuantiles 


Definición 8.6: 


El propósito de las gráficas de cuantiles consiste en describir, en forma de muestra, la 
función de distribución acumulada que se estudió en el capítulo 3. 


Un cuantil de una muestra, q(f), es un valor para el que una fracción específica f de los 
valores de los datos es menor que o igual a g(f). 


Evidentemente, un cuantil representa una estimación de una característica de una 
población o, más bien, la distribución teórica. La mediana de la muestra es q(0.5). El 
percentil 75 (cuartil superior) es q(0.75) y el cuartil inferior es q(0.25). 

Una gráfica de cuantiles simplemente grafica los valores de los datos en el eje 
vertical contra una evaluación empírica de la fracción de observaciones excedidas por 
los valores de los datos. Para propósitos teóricos esta fracción se calcula con 


donde ¡es el orden de las observaciones cuando se ordenan de la menor a la mayor. En 
otras palabras, si denotamos las observaciones ordenadas como 


Ya Уо) Уз) = S Yin- Ж Ya) 


entonces la gráfica de cuantiles describe una gráfica de у, contra f. En la figura 8.15 
se presenta la gráfica de cuantiles para las asas de las latas de pintura analizadas con 
anterioridad. 

A diferencia de la gráfica de caja y extensión, la gráfica de cuantiles realmente mues- 
tra todas las observaciones. Todos los cuantiles, incluidos la mediana y los cuantiles supe- 
rior e inferior, se pueden aproximar de forma visual. Por ejemplo, observamos fácilmente 
una mediana de 35 y un cuartil superior de alrededor de 36. Las agrupaciones relativa- 
mente grandes en torno a valores específicos se indican por pendientes cercanas a cero; 
mientras que los datos escasos en ciertas áreas producen pendientes más abruptas. La 
figura 8.15 describe la dispersión de datos de los valores 28 a 30, pero una densidad relati- 
vamente alta de 36 a 38. En los capítulos 9 y 10 proseguimos con las gráficas de cuantiles 
mediante la ilustración de formas útiles en que es posible comparar distintas muestras. 

Debería ser muy evidente para el lector que detectar si un conjunto de datos proviene 
о no de una distribución normal puede ser una herramienta importante para el analista de 
datos. Como antes indicamos en esta sección, a menudo suponemos que la totalidad o 
subconjuntos de las observaciones en un conjunto de datos son realizaciones de variables 
aleatorias normales independientes idénticamente distribuidas. Una vez más, la gráfica de 
diagnóstico a menudo se agrega a (con fines de presentación) una prueba de bondad del 
ajuste formal de los datos. Las pruebas de bondad del ajuste se estudiarán en el capítulo 
10. Los lectores de un artículo o informe científico suelen considerar la información de 
diagnóstico mucho más clara, menos árida y quizá menos aburrida que un análisis formal. 
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Figura 8.15: Gráfica de cuantiles para los datos de la pintura. 


En los capítulos siguientes (del 9 al 13) nos enfocaremos nuevamente en los métodos de 
detección de desviaciones de la normalidad como un agregado de la inferencia estadística 
formal. Las gráficas de cuantiles son útiles para detectar los tipos de distribución. En la 
elaboración de modelos y en el diseño de experimentos también hay situaciones en que 
se utilizan las gráficas para detectar términos o efectos del modelo que están activos. 
En otras situaciones se utilizan para determinar si las suposiciones subyacentes que el 
científico o el ingeniero hicieron en la construcción del modelo son o no razonables. En 
los capítulos 11, 12 y 13 se incluyen muchos ejemplos con ilustraciones. La siguiente 
subsección brinda un análisis y un ejemplo de una gráfica de diagnóstico denominada 
gráfica de cuantiles-cuantiles normales. 


Gráfica de cuantiles-cuantiles normales 


La gráfica de cuantiles-cuantiles normales aprovecha lo que se conoce sobre los cuantiles 
de la distribución normal. La metodología incluye una gráfica de los cuantiles empíri- 
cos recién analizados, contra el cuantil correspondiente de la distribución normal. Ahora, 
la expresión para un cuantil de una variable aleatoria N(u, с) es muy complicada. Sin 
embargo, una buena aproximación es dada por 


quof) = p + {4.910794 — (1 494). 


La expresión entre las llaves (el múltiplo de с) es la aproximación para el cuantil corres- 
pondiente para la variable aleatoria N(0, 1), es decir, 


qg = 4.911794 — (1-4 
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Definición 8.7: La gráfica de cuantiles-cuantiles normales es una gráfica de Ya (Observaciones orde- 


3 
Ж) 
nadas) contra 40,1 (fi), donde f; = TE ; 


Una relación cercana a una línea recta sugiere que los datos provienen de una distribución 
normal. La intersección en el eje vertical es una estimación de la media de la población u 
y la pendiente es una estimación de la desviación estándar с. La figura 8.16 presenta una 
gráfica de cuantiles-cuantiles normales para los datos de las latas de pintura. 
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34 
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Figura 8.16: Gráfica de cuantiles-cuantiles normales para los datos de la pintura. 


Graficación de la probabilidad normal 


Observe cómo la desviación de la normalidad se vuelve evidente gracias a la apariencia 
de la gráfica. La asimetría que exhiben los datos produce cambios en la pendiente. 

Las ideas para graficar la probabilidad se manifiestan en versiones diferentes de la 
gráfica de cuantiles-cuantiles normales que se presentó aquí. Por ejemplo, se ha puesto 
mucha atención a la llamada gráfica de probabilidad normal, en la que f se grafica con- 
tra los valores de los datos ordenados en un papel especial y la escala utilizada da como 
resultado una línea recta. Además, una gráfica alternativa utiliza los valores esperados 
de las observaciones clasificadas para la distribución normal y dibuja las observaciones 
clasificadas contra su valor esperado, bajo el supuesto de datos de N(u, с). Una vez más, 
la línea recta es el criterio gráfico que se emplea. Continuamos sugiriendo que basarse en 
los métodos analíticos gráficos que se describen en esta sección ayudará a comprender los 
métodos formales que permiten distinguir muestras diferentes de datos. 
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Ejemplo 8.12: | Considere los datos del ejercicio 10.41 en la página 358 del capítulo 10. En el estudio 
“Retención de nutrientes y respuesta de comunidades de macroinvertebrados ante la pre- 
sión de aguas residuales en un ecosistema fluvial”, que se llevó a cabo en el departamen- 
to de zoología del Virginia Polytechnic Institute y la universidad estatal, se recabaron 
datos sobre mediciones de densidad (número de organismos por metro cuadrado) en dos 
diferentes estaciones colectoras. En el capítulo 10 se dan detalles con respecto a los mé- 
todos analíticos de comparación de muestras para determinar si ambas provienen de la 
misma distribución N(u, 0). Los datos se presentan en la tabla 8.1. 


Tabla 8.1: Datos para el ejemplo 8.12 


Número de organismos por metro cuadrado 


Estación 1 Estación 2 
5,030 4,980 2,800 2,810 
13,700 11,910 4,670 1,330 
10,730 8,130 6,890 3,320 
11,400 26,850 7,720 1,230 
860 17,660 7,030 2,130 
2,200 22,800 7,330 2,190 
4,250 1,130 
15,040 1,690 


Dibuje una gráfica de cuantiles-cuantiles normales y saque conclusiones con respecto a 
si es razonable o no suponer que las dos muestras provienen de la misma distribución 


n(x; и, 0). 
25,000 
20,000 
15,000 
= 
© 
5 
о 
10,000 
5,000 Estación 1 


Estación 2 


=2 =1 0 1 2 


Cuantil normal estándar, 9.00) 


Figura 8.17: Gráfica de cuantiles-cuantiles normales рага los datos de densidad del ejemplo 8.12. 
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Solución: La figura 8.17 muestra la gráfica de cuantiles-cuantiles normales para las mediciones de 
densidad. La gráfica se aleja mucho de una sola línea recta. De hecho, los datos de la 
estación 1 reflejan pocos valores en la cola inferior de la distribución y varios en la cola 
superior. El “agrupamiento” de observaciones hace que parezca improbable que las dos 
muestras provengan de una distribución común N(u, с). 

Aunque hemos concentrado nuestra explicación y ejemplo en las gráficas de proba- 
bilidad para distribuciones normales, podemos enfocarnos en cualquier distribución. Tan 
sólo necesitaríamos calcular cantidades de forma analítica para la distribución teórica en 


cuestión. 


Ejercicios 


8.37 Рага una distribución chi cuadrada calcule 
а) 5 оѕ cuando v = 15; 

b) Xó.0 cuando v = 7; 

с) Xó.0s cuando у = 24. 


8.38 Рага una distribución chi cuadrada, calcule 
a) X%.005 cuando v = 5; 
b) Жр. cuando v = 19; 
c) Xó.o cuando у = 12. 


8.39 Para una distribución chi cuadrada calcule Ха > 
tal que 

а) Р(Х? > х2) = 0.99 cuando у = 4; 

b) Р(Х? > х2) = 0.025 cuando у = 19; 

с) Р(37.652 < X < х) = 0.045 cuando у = 25. 


8.40 Рага una distribución chi cuadrada calcule Жс, 
tal que 


а) Р(Х? > х2) = 0.01 cuando у = 21; 
b) Р(Х? <x 2) = 0.95 cuando v = 6; 
с) Р(ҳ2<Х° < 23.209) = 0.015 cuando v = 10. 


8.41 Suponga que las varianzas muestrales son me- 
diciones continuas. Calcule la probabilidad de que una 
muestra aleatoria de 25 observaciones, de una pobla- 
ción normal con varianza 0? = 6, tenga una varianza 
muestral 52 

a) mayor que 9.1; 

b) entre 3.462 y 10.745. 


8.42 Las calificaciones de un examen de colocación 
que se aplicó a estudiantes de primer año de una uni- 
versidad durante los últimos cinco años tienen una dis- 
tribución aproximadamente normal con una media u = 
74 y una varianza 0? = 8. ¿Seguiría considerando que 
т? = 8 es un valor válido de la varianza si una muestra 
aleatoria de 20 estudiantes, a los que se les aplica el 


examen de colocación este año, obtienen un valor de 
A: 
52 = 20? 


8.43 Demuestre que la varianza de 5° para muestras 
aleatorias de tamaño n de una población normal dismi- 
nuye a medida que aumenta n. [Sugerencia: primero 
calcule la varianza de (n — 1)5 2/02]. 


8.44 а) Calcule 1, ,,, cuando у = 14. 
b) Calcule —+£ 


оло “uando > = 10. 
c) Calcule t; cuando у = 7. 
8.45 а) Calcule P(T < 2.365) cuando v = 7. 

b) Calcule P(T > 1.318) cuando v = 24. 

c) Calcule Р(—1.356 < T < 2.179) cuando v = 12. 
d) Calcule P(T > -2.567) cuando v = 17. 


8.46 а) Calcule P(-t 


0.005 


b) Calcule P(T > —t, 


0.0257 * 


< T < ИТТ 


) para у = 20. 
8.47 Dada una muestra aleatoria de tamaño 24 de una 
distribución normal, calcule k tal que 

a) P(-2.069 < T < k) = 0.965; 

b) P(k < T < 2.807) = 0.095; 

с) P(—k < T < k) = 0.90. 


8.48 Una empresa que fabrica juguetes electrónicos 
afirma que las baterías que utiliza en sus productos 
duran un promedio de 30 horas. Para mantener este 
promedio se prueban 16 baterías cada mes. Si el valor 
t calculado cae entre —t y»; У top, la empresa queda sa- 
tisfecha con su afirmación. ¿Qué conclusiones debería 
sacar la empresa a partir de una muestra que tiene una 
media de x = 27.5 horas y una desviación estándar de 
s = 5 horas? Suponga que la distribución de las dura- 
ciones de las baterías es aproximadamente normal. 


8.49 Una población normal con varianza desconocida 
tiene una media de 20. ¿Es posible obtener una mues- 
tra aleatoria de tamaño 9 de esta población con una me- 
Ча de 24 y una desviación estándar de 4.1? Si no fuera 
posible, ¿a qué conclusión llegaría? 
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8.50 Un fabricante de cierta marca de barras de cereal 
con bajo contenido de grasa afirma que el contenido pro- 
medio de grasa saturada en éstas es de 0.5 gramos. En 
una muestra aleatoria de 8 barras de cereal de esta marca 
se encontró que su contenido de grasa saturada era de 
0.6, 0.7, 0.7, 0.3, 0.4, 0.5, 0.4 y 0.2. ¿Estaría de acuerdo 
con tal afirmación? Suponga una distribución normal. 


8.51 Para una distribución F calcule: 
а) faos con v, =7 y v, = 15; 
b) fos conv, =15 y v,=7; 
с) fio con v, = 24 y v, = 19; 
d) Јо сопу, = 19 y v, = 24; 
e) fosg CON V, = 28 y v, = 12. 


8.52 Se aplican pruebas a 10 cables conductores 
soldados a un dispositivo semiconductor con el fin de 
determinar su resistencia a la tracción. Las pruebas de- 
mostraron que para romper la unión se requieren las 
libras de fuerza que se listan a continuación: 


19.8 12.7 13.2 16.9 10.6 
18.8 11.1 14.3 17.0 12.5 


Otro conjunto de 8 cables conductores que forman un 
dispositivo se encapsuló y se probó para determinar si 
el encapsulado aumentaba la resistencia a la tracción. 
Las pruebas dieron los siguientes resultados: 


24.9 22.8 23.6 22.1 20.4 21.6 21.8 22.5 


Comente acerca de la evidencia disponible respecto a 
la igualdad de las dos varianzas de población. 


8.53 Considere las siguientes mediciones de la capa- 


Ejercicios de repaso 


8.56 Considere los datos que se presentan en el ejer- 
cicio 1.20 de la página 31. Dibuje una gráfica de caja 
y extensión, y comente acerca de la naturaleza de la 
muestra. Calcule la media muestral y la desviación es- 
tándar de la muestra. 


8.57 Si Х, X,- X, son variables aleatorias inde- 
pendientes que tienen distribuciones exponenciales 
idénticas con parámetro 0, demuestre que la función 
de densidad de la variable aleatoria Y = X + X, ++ 
X, es la de una distribución gamma con parámetros 


a=nyfB=0. 

8.58 Al probar el monóxido de carbono que contiene 
cierta marca de cigarrillos, los datos que se obtuvieron, 
en miligramos por cigarrillo, se codificaron restando 12 
a cada observación. Utilice los resultados del ejercicio 
8.14 de la página 231 para calcular la desviación es- 
tándar del contenido de monóxido de carbono de una 
muestra aleatoria de 15 cigarrillos de esta marca, si las 
mediciones codificadas son 3.8, —0.9, 5.4, 4.5, 5.2, 5.6, 
—0.1,—0.3, —1.7,,3.7,3.3,4.4, —0:5 y 1.9. 
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cidad de producción de calor del carbón producido por 
dos minas (en millones de calorías por tonelada): 


Mina 1: 8260 8130 8350 8070 8340 
Mina 2: 7950 7890 7900 8140 7920 7840 


¿Se puede concluir que las dos varianzas de población 
son iguales? 


8.54  Dibuje una gráfica de cuantiles con los siguientes 
datos, que representan la vida, en horas, de cincuenta 
lámparas incandescentes esmeriladas de 40 watts y 110 
voltios, tomados de pruebas de vida forzadas: 


919 1196 785 1126 936 918 
1156 920 948 1067 1092 1162 
1170 929 950 905 972 1035 
1045 855 1195 1195 1340 1122 
938 970 1237 956 1102 1157 
978 832 1009 1157 1151 1009 
765 958 902 1022 1333 811 
1217 1085 896 958 1311 1037 
702 923 


8.55 Dibuje una gráfica de cuantiles-cuantiles nor- 
males con los siguientes datos, que representan los 
diámetros de 36 cabezas de remache en 1/100 de una 
pulgada: 


6.72 6.77 6.82 6.70 6.78 6.70 6.62 
6.75 6.66 6.66 6.64 6.76 6.73 6.80 
6.72 6.76 6.76 6.68 6.66 6.62 6.72 
6.76 6.70 6.78 6.76 6.67 6.70 6.72 
6.74 6.81 6.79 6.78 6.66 6.76 6.76 
6.72 


8.59 SiS?yS 2 representan las varianzas de muestras 
aleatorias independientes de tamaños п, = 8 y n, = 12, 
tomadas de poblaciones normales con varianzas igua- 
les, calcule P(S? / $2 < 4.89). 


8.60 Una muestra aleatoria de 5 presidentes de ban- 
cos indicó sueldos anuales de $395,000, $521,000, 
$483,000, $479,000 y $510,000. Calcule la varianza de 
este conjunto. 


8.61 Si el número de huracanes que azotan cierta área 
del este de Estados Unidos cada año es una variable alea- 
toria que tiene una distribución de Poisson con и = 6, 
calcule la probabilidad de que esta área sea azotada por 
a) exactamente 15 huracanes en 2 años; 
b) alo sumo 9 huracanes en 2 años. 


8.62 Una empresa de taxis prueba una muestra alea- 
toria de 10 neumáticos radiales con bandas tensoras de 
acero de cierta marca y registra los siguientes desgastes 
de la banda: 48,000, 53,000, 45,000, 61,000, 59,000, 
56,000, 63,000, 49,000, 53,000 y 54,000 kilómetros. 


Ejercicios de repaso 


Utilice los resultados del ejercicio 8.14 de la página 
231 para calcular la desviación estándar de este con- 
junto de datos dividiendo primero cada observación 
entre 1000 y después restando 55 al resultado. 


8.63 Considere los datos del ejercicio 1.19 de la 
página 31. Dibuje una gráfica de caja y extensión. 
Comente y calcule la media muestral y la desviación 
estándar muestral. 


8.64 SiS? y 52 representan las varianzas de muestras 
aleatorias independientes de tamaños n, = 25 y n, = 
31, tomadas de poblaciones normales con varianzas or 


=10y ra = 15, respectivamente, calcule 
P(Sí /S2 > 1.26). 


8.65 Considere el ejemplo 1.5 de la página 25. 
Comente acerca de cualquier valor extremo. 


8.66 Considere el ejercicio de repaso 8.56. Comente 
acerca de cualquier valor extremo en los datos. 


8.67 La resistencia a la rotura X de cierto remache 
que se utiliza en el motor de una máquina tiene una 
media de 5000 psi y una desviación estándar de 400 
psi. Se toma una muestra aleatoria de 36 remaches. 
Considere la distribución de X, la media muestral de la 
resistencia a la rotura. 
a) ¿Cuál es la probabilidad de que la media de la 
muestra caiga entre 4800 psi y 5200 psi? 
b) ¿Qué muestra n sería necesaria para tener 


P(4900 < X < 5100) = 0.992 


8.68 Considere la situación del ejercicio de repaso 
8.62. Si la población de la cual se tomó la muestra tiene 
una media poblacional u = 53,000 kilómetros, ¿esta in- 
formación de la muestra parece apoyar esa afirmación? 
En su respuesta calcule 


y 253000 


5/00 


y determine, consultando la tabla A.4 (con 9 g.l.), si el 
valor т calculado es razonable о si parece ser un suceso 
raro. 


8.69 Se consideran dos propulsores de combustible 
sólido distintos, el tipo A y el tipo B, para una actividad 
del programa espacial. Las velocidades de combustión 
en el propulsor son fundamentales. Se toman muestras 
aleatorias de 20 especímenes de los dos propulsores 
con medias muestrales de 20.5 cm/s para el propulsor 
A y de 24.50 cm/s para el propulsor В. Por lo general 
se supone que la variabilidad en la velocidad de com- 
bustión es casi igual para los dos propulsores y que es 
determinada por una desviación estándar de población 
de 5 cm/s. Suponga que la velocidad de combustión 
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para cada propulsor es aproximadamente normal, por 
lo cual se debería utilizar el teorema del límite central. 
Nada se sabe acerca de las medias poblacionales de las 
dos velocidades de combustión y se espera que este ex- 
perimento revele algo sobre ellas. _ р 
а) Si, de hecho, ра = рв, ¿cuál será Р(Хв – Ха 
> 4.0)? 
b) Utilice lo que respondió en el inciso а) рага dar luz 
sobre la validez de la proposición и, = и,. 


8.70 La concentración de un ingrediente activo en 
el producto de una reacción química es fuertemente 
influido por el catalizador que se usa en la reacción. 
Se considera que cuando se utiliza el catalizador A la 
concentración media de la población excede el 65%. 
Se sabe que la desviación estándar es с = 5%. Una 
muestra de productos tomada de 30 experimentos inde- 
pendientes proporciona la concentración promedio de 
X, = 64.5%. 

a) ¿Esta información muestral, con una concentra- 
ción promedio de x,= 64.5%, ofrece información 
inquietante de que quizá и, no sea el 65% sino me- 
nos que ese porcentaje? Respalde su respuesta con 
una aseveración de probabilidad. 

b) Suponga que se realiza un experimento similar 
utilizando otro catalizador, el B. Se supone que la 
desviación estándar с sigue siendo 5% y Xx, resulta 
ser 70%. Comente si la información muestral del 
catalizador В sugiere con certeza que и, es en rea- 
lidad mayor que и,. Respalde su respuesta calcu- 
lando 

P(Šs —Xa 25.5 | рв = pa). 

с) En el caso de que и, = и, = 65%, determine la 
distribución aproximada de las siguientes canti- 
dades (con la media y la varianza de cada una). 
Utilice el teorema del límite central. 


DXs; _ 
ii)X a — Хв А 
jj) La 


01/2/30 ` 


8.71 Con la información del ejercicio de repaso 8.70 
calcule (suponiendo и, = 65%) Р(Хв > 70). 


8.72 Dada una variable aleatoria normal X con media 
20 y varianza 9, y una muestra aleatoria de tamaño n 
tomada de la distribución, ¿qué tamaño de la muestra 
n se necesita para que 


Р(19.9 < X < 20.1) = 0.95? 


8.73 Enel capítulo 9 se estudiará con detenimiento el 
concepto de estimación de parámetros. Suponga que 
X es una variable aleatoria con media и y varianza 0? = 
1.0. Además, suponga que se toma una muestra aleato- 
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ria de tamaño п y que Х se utiliza como un estimado de 
и. Cuando se toman los datos y se mide la media de la 
muestra, deseamos que ésta esté dentro de 0.05 unida- 
des de la media real con una probabilidad de 0.99. Es 
decir, aquí queremos que haya muchas posibilidades de 
que la х calculada de la muestra esté “muy cerca de” la 
media de población (¡dondequiera que ésta se encuen- 
tre!), de manera que deseamos 


P(|X — ш > 0.05) = 0.99. 


¿Qué tamaño de muestra se requiere? 


8.74 Suponga que se utiliza una máquina para llenar 
envases de cartón con un líquido. La especificación 
que es estrictamente indispensable para el llenado de 
la máquina es 9 + 1.5 onzas. El proveedor considera 
que cualquier envase de cartón que no cumpla con tales 
límites de peso en el llenado está defectuoso. Se espera 
que al menos 99% de los envases de cartón cumplan 
con la especificación. En el caso de que u = 9 ус = 
1, ¿qué proporción de envases de cartón del proceso 
están defectuosos? Si se hacen cambios para reducir la 
variabilidad, ¿cuánto se tiene que reducir с para que 
haya 0.99 de probabilidades de cumplir con la especifi- 
cación? Suponga una distribución normal para el peso. 


8.75 Considere la situación del ejercicio de repaso 
8.74. Suponga que se hace un gran esfuerzo para “es- 
trechar” la variabilidad del sistema. Después de eso se 
toma una muestra aleatoria de tamaño 40 de la nueva 
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línea de ensamble y se obtiene que la varianza de la 
muestra es s? = 0.188 onzas’. ¿Tenemos evidencia 
numérica sólida de que о? se redujo a menos de 1.0? 
Considere la probabilidad 


P(S? <0.188 | o” = 1.0), 


y dé una conclusión. 


8.76 Proyecto de grupo: Divida al grupo en equipos 
de cuatro estudiantes. Cada equipo deberá ir al gimna- 
sio de la universidad o a un gimnasio local y pregun- 
tar a cada persona que cruce el umbral cuánto mide en 
pulgadas. Después, cada equipo dividirá los datos de 
las estaturas por género y trabajará en conjunto para 
realizar las actividades que se indican a continuación. 

a) Dibujen una gráfica de cuantiles-cuantiles normal 
con los datos. Si usan la gráfica como base, ¿les 
parecería que los datos tienen una distribución 
normal? 

b) Utilicen la varianza muestral como un estimado de 
la varianza real para cada género. Supongan que la 
estatura media de la población de los hombres es 
realmente tres pulgadas más grande que la de las 
mujeres. ¿Cuál es la probabilidad de que la esta- 
tura promedio de los hombres sea 4 pulgadas más 
grande que la de las mujeres en su muestra? 

c) ¿Qué factores podrían provocar que estos resulta- 
dos sean engañosos? 


8.9 Posibles riesgos y errores conceptuales. Relación 


con el material de otros capítulos 


El teorema del límite central es una de las más poderosas herramientas de la estadística, 
y aunque este capítulo es relativamente breve, contiene gran cantidad de información 
fundamental acerca de las herramientas que se utilizarán en el resto del libro. 

El concepto de distribución muestral es una de las ideas fundamentales más impor- 
tantes de la estadística y, en este momento de su entrenamiento, el estudiante debería 
entenderlo con claridad antes de continuar con los siguientes capítulos, en los cuales 
se continuarán utilizando ampliamente las distribuciones muestrales. Suponga que se 
quiere utilizar el estadístico X para hacer inferencias acerca de la media de la población 
u, lo cual se hace utilizando el valor observado x de una sola muestra de tamaño л. 
Luego, cualquier inferencia deberá hacerse tomando en cuenta no sólo el valor único, 
sino también la estructura teórica o la distribución de todos los valores Х que se po- 
drían observar a partir de las muestras de tamaño n. Como resultado de lo anterior 
surge el concepto de distribución muestral, que es la base del teorema del límite central. 
Las distribuciones Т, X y F también se utilizan en el contexto de las distribuciones 
muestrales. Por ejemplo, la distribución т, que se ilustra en la figura 8.8, representa la 
estructura que ocurre si se forman todos los valores de ур donde х y s se toman de las 
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muestras de tamaño п de una distribución n(x; и, с). Se pueden hacer comentarios simi- 
lares en relación con x? y F, y el lector no debería olvidar que la información muestral 
que conforma los estadísticos para todas estas distribuciones es la normal. Por lo tanto, 
se podría afirmar que donde haya una £, F o x la fuente era una muestra de una 
distribución normal. 

Podría parecer que las tres distribuciones antes descritas se presentaron de una 
forma bastante aislada, sin indicar a qué se refieren. Sin embargo, aparecerán en la reso- 
lución de problemas prácticos a lo largo del texto. 

Ahora bien, hay tres cuestiones que se deben tener presentes para evitar que haya 
confusión respecto a estas distribuciones muestrales fundamentales: 


1) No se puede usar el teorema del límite central a menos que se conozca с. Para usar 
el teorema del límite central cuando no se conoce с se debe reemplazar con s, la 
desviación estándar de la muestra. 


11) El estadístico T no es un resultado del teorema del límite central y ХХХ, deben 
. . . .» . x =p . . s И 
provenir de una distribución nx; А, о) para que = Түт Sea una distribución f; por su- 
puesto, 5 es tan sólo una estimación de с. 


111) Aunque el concepto de grados de libertad es nuevo en este punto, debería ser muy 
intuitivo, ya que es razonable que la naturaleza de la distribución de S y también t 
deban depender de la cantidad de información en la muestra х, х,,..., X, 


п 


Capítulo 9 


Problemas de estimación 
de una y dos muestras 


9.1 Introducción 


En los capítulos anteriores destacamos las propiedades del muestreo de la media y de la 
varianza muestrales. También destacamos las representaciones de datos en varias for- 
mas. El propósito de estas presentaciones es establecer las bases que permitan a los es- 
tadísticos sacar conclusiones acerca de los parámetros de poblaciones tomadas de datos 
experimentales. Por ejemplo, el teorema del límite central brinda información sobre la 
distribución de la media muestral X. La distribución incluye la media de la población p. 
Por consiguiente, cualesquiera conclusiones respecto a u, extraídas de un promedio 
muestral observado, deben depender de lo que se sabe acerca de su distribución mues- 
tral. Se podría decir algo similar en lo que se refiere a <? y с?. Como es evidente, es muy 
probable que cualquier conclusión que saquemos acerca de la varianza de una distribu- 
ción normal implique la distribución muestral de S?. 

En este capítulo comenzaremos por presentar de manera formal el propósito de 
la inferencia estadística. Continuaremos con el análisis del problema de la estima- 
ción de los parámetros de la población. Restringiremos nuestros desarrollos formales 
de los procedimientos de estimación específicos a problemas que impliquen una y dos 
muestras. 


9.2 Inferencia estadística 


En el capítulo 1 presentamos la filosofía general de la inferencia estadística formal. La 
inferencia estadística consta de los métodos mediante los cuales se hacen inferencias o 
generalizaciones acerca de una población. La tendencia actual es distinguir entre el mé- 
todo clásico de estimación de un parámetro de la población, donde las inferencias se 
basan estrictamente en información obtenida de una muestra aleatoria seleccionada de la 
población, y el método bayesiano, el cual utiliza el conocimiento subjetivo que ya se 
posee sobre la distribución de probabilidad de los parámetros desconocidos junto con la 
información que proporcionan los datos de la muestra. En la mayor parte de este capítu- 
lo utilizaremos los métodos clásicos para estimar los parámetros de la población desco- 
nocidos, como la media, la proporción y la varianza, mediante el cálculo de estadísticos 
de muestras aleatorias y la aplicación de la teoría de las distribuciones muestrales, gran 
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parte de lo cual se estudió en el capítulo 8. La estimación bayesiana se analizará en el 
capítulo 18. 

La inferencia estadística se puede dividir en dos áreas principales: estimación y 
pruebas de hipótesis. Trataremos estas dos áreas por separado: en este capítulo veremos 
la teoría y las aplicaciones de la estimación, y en el capítulo 10 revisaremos la prueba de 
hipótesis. Para distinguir claramente un área de la otra, considere los siguientes ejemplos. 
Un candidato a un cargo público podría estar interesado en estimar la verdadera proporción 
de votantes que lo favorecerán mediante la obtención de las opiniones de una muestra 
aleatoria de 100 de ellos. La parte de votantes en la muestra que favorecerán al candidato 
se podría utilizar como un estimado de la verdadera proporción en la población de votan- 
tes. El conocimiento de la distribución muestral de una proporción nos permite establecer 
el grado de exactitud de tal estimado. Este problema cae en el área de la estimación. 

Considere ahora el caso de alguien a quien le interesa averiguar si la marca A de cera 
para piso es más resistente al desgaste que la marca B. Se podría plantear la hipótesis de 
que la marca A es mejor que la marca B y, después de la prueba adecuada, aceptar o re- 
chazar dicha hipótesis. En este ejemplo no intentamos estimar un parámetro, sino llegar 
a una decisión correcta acerca de una hipótesis planteada previamente. Una vez más, 
dependemos de la teoría del muestreo y de utilizar datos que nos proporcionen alguna 
medida del grado de exactitud de nuestra decisión. 


9.3 Métodos de estimación clásicos 


La estimación puntual de algún parámetro de la población @ es un solo valor б de un 
estadístico Ó. Por ejemplo, el valor х del estadístico X, que se calcula a partir de una 
muestra de tamaño n, es una estimación puntual del parámetro de la población pu. 
De manera similar, р = x /n es una estimación puntual de la verdadera proporción р para 
un experimento binomial. 

No se espera que un estimador logre estimar el parámetro de la población sin error. 
No se espera que X estime p con exactitud, lo que en realidad se espera es que no esté 
muy alejada. Para una muestra específica, la manera en que se podría obtener un estima- 
do más cercano de y es utilizando la mediana de la muestra X como estimador. Consi- 
dere, por ejemplo, una muestra que consta de los valores 2, 5 y 11 de una población cuya 
media es 4, la cual, supuestamente, se desconoce. Podríamos estimar u para que sea х = 6 
usando la media muestral como nuestro estimado, o bien, YX = 5 utilizando la mediana 
muestral. En este caso el estimador X produce una estimación más cercana al parámetro 
verdadero que la que produce el estimador X . Por otro lado, si nuestra muestra aleatoria 
contiene los valores 2, 6 y 7, entonces х = 5 ух = 6, de manera que el mejor estima- 
dor es X. Cuando no conocemos el valor real de u, tenemos que comenzar por decidir 
qué estimador utilizaremos, si X о Ж. 


Estimador insesgado 


¿Cuáles son las propiedades que una “buena” función de decisión debería tener para 
poder influir en nuestra elección de un estimador en vez de otro? Sea Ó un estimador 
cuyo valor Ê es una estimación puntual de algún parámetro de la población descono- 
cido 6. Sin duda desearíamos que la distribución muestral de Ó tuviera una media igual 
al parámetro estimado. Al estimador que tuviera esta propiedad se le llamaría estimador 
insesgado. 
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Definición 9.1: Se dice que un estadístico Ó es un estimador insesgado del parámetro Ө si 


ò = Е(Ө) = Ө. 


Ejemplo 9.1: | Demuestre que $? es un estimador insesgado del parámetro o°. 


Solución: En la sección 8.5, en la página 244, demostramos que 


Ух, -X = Ух, -u —n(X – py. 


ї=1 і=1 


Entonces, 


A Е |! еу 


n=1. 
i=l 
n 1 n 
= VE(X;¡ – Ш)? -nE (X – ш)? | = od — по 
п 4 п=1 \‹ | 
i=l i=l 
Sin embargo, o? 
оў =0?, para i =1,2,...,n, YO = —. 
| п 


Por lo tanto, 


1 o 
Е(82) = — | па? -n— | = о2. 
п – 1 Е | 
Aunque 5? еѕ un estimador insesgado de с, S, por otro lado, suele ser un estimador 
sesgado de с, un sesgo que en el caso de muestras grandes se vuelve insignificante. Este 
ejemplo ilustra por qué dividimos entre n — 1 en vez de entre n cuando estimamos la 


varianza. 


Varianza de un estimador puntual 


Si Ө, у Ө, son dos estimadores insesgados del mismo parámetro de la población 6, de- 
seamos elegir el бошо от cuya distribución muestral tenga la menor varianza. Por lo 
tanto, si оў < оў decimos que Ө, es un estimador más eficaz de Ө que Ө, 


Definición 9.2: Si consideramos todos los posibles estimadores insesgados de algún parámetro 0, al 
que tiene la menor varianza lo llamamos estimador más eficaz de 6. 


En la figura 9.1 se ilustran las distribuciones muestrales de tres estimadores diferen- 
tes ô, Ô, y Ô, todos para 6. Es evidente que sólo Ө, у ô, no son sesgados, ya que sus 
distribuciones están centradas en 6. El estimador Ө, tiene. una varianza menor que Ө, 
por lo tanto, es más eficaz. En consecuencia, el estimador de Ө que elegiríamos, entre ls 
tres que estamos considerando, sería Ө. 

Para poblaciones normales se puede demostrar que tanto X como X son estimadores 
insesgados de la media de la población u, pero la varianza de X es más pequeña que la 
varianza de X. Por consiguiente, los estimados х y X serán, en promedio, iguales a 
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Figura 9.1: Distribuciones muestrales de diferentes estimadores de 6. 


la media de la población 1, aunque podría ser que х esté más cerca de р para una mues- 
tra dada y, por lo tanto, que X sea más eficaz que X. 


Estimación por intervalo 


Podría ser que ni el estimador insesgado más eficaz estime con exactitud el parámetro de 
la población. Es cierto que la exactitud de la estimación aumenta cuando las muestras 
son grandes; pero incluso así no tenemos razones para esperar que una estimación pun- 
tual de una muestra dada sea exactamente igual al parámetro de la población que se 
supone debe estimar. Hay muchas situaciones en que es preferible determinar un inter- 
valo dentro del cual esperaríamos encontrar el valor del parámetro. Tal intervalo se co- 
noce como estimación por intervalo. 

Una estimación por intervalo de un parámetro de la población Ө es un intervalo de 
la forma б, <0< б. donde @ LY ô y dependen del valor del estadístico ө рага una mues- 
tra especilica, y también de la distribución de muestreo de Ө. Por ejemplo, una muestra 
aleatoria de calificaciones verbales de la prueba SAT para estudiantes universitarios de 
primer año produciría un intervalo de 530 a 550, dentro del cual esperamos encontrar el 
promedio verdadero de todas las calificaciones verbales de la prueba SAT para ese gru- 
po. Los valores de los puntos extremos, 530 y 550, dependerán de la media muestral 
calculada х y de la distribución de muestreo de X. A medida que aumenta el tamaño de 
la muestra, sabemos que о = o) n disminuye y, en consecuencia, cabe la posibilidad 
de que nuestra estimación se acerque más al parámetro 4, lo cual daría como resultado 
un intervalo más corto. De esta manera, el intervalo de la estimación indica, por su lon- 
gitud, la precisión de la estimación puntual. Un ingeniero obtendrá información acerca 
de la proporción de la población de artículos defectuosos tomando una muestra y cal- 
culando la proporción muestral defectuosa, sin embargo, una estimación por intervalo 
podría ser más informativa. 


Interpretación de las estimaciones por intervalo 


Como muestras distintas suelen producir valores diferentes de Ө y, por lo tanto, valores 
diferentes de б, y Ж estos puntos extremos del intervalo son valores de las variables 
aleatorias correspondientes Ө, у ô, De la distribución muestral de Ô seremos 
capaces de determinar Ө, у ô, de manera que P (Ө, < Ө < Ôv) sea igual a cualquier 
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valor positivo de una fracción que queramos especificar. Si, por ejemplo, calculamos Ө 
¿Y O, tales que 


P(Ó, <0<Óy)=1-0, 


para 0 < а < 1, tenemos entonces una probabilidad de 1 — а de seleccionar una muestra 
aleatoria que produzca un intervalo que contenga 0. El intervalo 0,< 0 < Ө, que se 
calcula a partir de la muestra seleccionada, se llama entonces intervalo de confianza del 
100(1 – @)%, la fracción 1 — а se denomina coeficiente de confianza o grado de con- 
fianza, y los extremos, б, y (Ж se denominan límites de confianza inferior y superior. 
Así, cuando @ = 0.05, tenemos un intervalo de confianza del 95%, y cuando а = 0.01 
obtenemos un intervalo de confianza más amplio del 99%. Cuanto más amplio sea 
el intervalo de confianza, más confiaremos en que contiene el parámetro desconocido. 
Desde luego, es mejor tener un 95% de confianza en que la vida promedio de cierto 
transistor de un televisor está entre los 6 y los 7 años, que tener un 99% de confianza en 
que esté entre los 3 y los 10 años. De manera ideal, preferimos un intervalo corto con un 
grado de confianza alto. Algunas veces las restricciones en el tamaño de nuestra muestra 
nos impiden tener intervalos cortos sin sacrificar cierto grado de confianza. 

En las siguientes secciones estudiaremos los conceptos de estimación puntual y por 
intervalos, y en cada sección presentaremos un caso especial diferente. El lector debería 
notar que, aunque la estimación puntual y por intervalos representan diferentes aproxi- 
maciones para obtener información respecto a un parámetro, están relacionadas debido 
a que los estimadores del intervalo de confianza se basan en estimadores puntuales. En 
la siguiente sección, por ejemplo, veremos que Xes un estimador puntual de y muy 
razonable. Como resultado, el importante estimador del intervalo de confianza de y 
depende del conocimiento de la distribución muestral de X. 

Empezaremos la siguiente sección con el caso más sencillo de un intervalo de con- 
fianza, en donde el escenario es simple pero poco realista. Nos interesa estimar una 
media de la población y cuando Ø todavía se desconoce. Evidentemente, si se desconoce 
H es muy improbable que se conozca с. Cualquier información histórica que produzca 
datos suficientes para permitir suponer que se conoce т probablemente habría producido 
información similar acerca de u. A pesar de este argumento iniciamos con este caso 
porque los conceptos y los mecanismos resultantes asociados con la estimación del 
intervalo de confianza también estarán asociados con las situaciones más realistas que 
presentaremos más adelante en la sección 9.4 y las siguientes. 
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La distribución muestral de X está centrada en p y en la mayoría de las aplicaciones la 
varianza es más pequeña que la de cualesquiera otros estimadores de u. Por lo tanto, se 
utilizará la media muestral x como una estimación puntual para la media de la población 
H. Recuerde que оў = o) n, por lo que una muestra grande producirá un valor de X 
procedente de una distribución muestral con varianza pequeña. Por consiguiente, es pro- 
bable que х sea una estimación muy precisa de и cuando n es grande. 

Consideremos ahora la estimación por intervalos de u. Si seleccionamos nuestra 
muestra a partir de una población normal o, a falta de ésta, si n es suficientemente gran- 
de, podemos establecer un intervalo de confianza para u considerando la distribución 
muestral de X. 
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De acuerdo con el teorema del límite central, podemos esperar que la distribución 
muestral de X esté distribuida de forma aproximadamente normal con media Шұ = Ш y 
desviación estándar су = oI п . Al escribir Zap Рага el valor z por arriba del cual 
encontramos una área de 0/2 bajo la curva normal, en la figura 9.2 podemos ver que 


Р(—20у2 < 2 < Zaj2) = 1-0, 
donde 


En consecuencia, 


1-а 
1 
ША O e,» 
—Za/2 0 Za/2 
Figura 9.2: Paja <7< 24р) = 1-а. 


Si multiplicamos cada término en la desigualdad por сД/л y después restamos X de 
cada término, y en seguida multiplicamos por — 1 (para invertir el sentido de las des- 
igualdades), obtenemos 


= O = o 
P (х ст <pu.<X +27) =1-Q. 


Se selecciona una muestra aleatoria de tamaño n de una población cuya varianza с? se 
conoce y se calcula la media х para obtener el intervalo de confianza 100(1 – 0)%. Es 
importante enfatizar que recurrimos al teorema del límite central citado anteriormente. 
Como resultado, es importante observar las condiciones para las aplicaciones que siguen. 


Intervalo 

de confianza 
de u cuando se 
conoce т? 


Si x es la media de una muestra aleatoria de tamaño n de una población de la que se co- 
noce su varianza o°, lo que da un intervalo de confianza de 100(1 – @)% рага p es 


a o Е [од 
Шш т ат 


donde z, у; es el valor z que deja una área de 2/2 a la derecha. 


En el caso de muestras pequeñas que se seleccionan de poblaciones no normales, no 
podemos esperar que nuestro grado de confianza sea preciso. Sin embargo, para muestras 
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de tamaño п > 30, en las que la forma de las distribuciones no esté muy sesgada, la teo- 
ría de muestreo garantiza buenos resultados. 

Queda claro que los valores de las variables aleatorias Ө, у Ô, las cuales se defi- 
nieron en la sección 9.3, son los límites de confianza 


А - с А _ с 
OL =x – 20у: >= Y Ou =Xx+Za2 r 
vi vi 

Muestras diferentes producirán valores diferentes de х y, por lo tanto, producirán dife- 
rentes estimaciones por intervalos del parámetro u, como se muestra en la figura 9.3. Los 
puntos en el centro de cada intervalo indican la posición de la estimación puntual х para 
cada muestra aleatoria. Observe que todos los intervalos tienen el mismo ancho, pues 
esto depende sólo de la elección de z, у; Una vez que se determina x. Cuanto más grande 
sea el valor de z, pque elijamos, más anchos haremos todos los intervalos, y podremos 
tener más confianza en que la muestra particular que seleccionemos producirá un inter- 
valo que contenga el parámetro desconocido и. En general, para una elección de z, 
100(1 — 0)% de los intervalos contendrá pu. 
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Figura 9.3: Estimaciones por intervalos de и para muestras diferentes. 


Ejemplo 9.2: | Se encuentra que la concentración promedio de zinc que se obtiene en una muestra de 
mediciones en 36 sitios diferentes de un río es de 2.6 gramos por mililitro. Calcule los 
intervalos de confianza del 95% y 99% para la concentración media de zinc en el río. 
Suponga que la desviación estándar de la población es de 0.3 gramos por mililitro. 

Solución: La estimación puntual de es х = 2.6. El valor z que deja una área de 0.025 а la derecha 
у, por lo tanto, una área de 0.975 а la izquierda es z, p; = 1.96 (véase la tabla А.З). En 
consecuencia, el intervalo de confianza del 95% es 


0.3 0.3 
2.6 – (1. — 2. I; — 
6 – ( 90) ( =) <и<2.6-+( 90) ( =}, 
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que se reduce a 2.50 < u < 2.70. Para calcular un intervalo de confianza del 99% encon- 
tramos el valor z que deja una área de 0.005 a la derecha y de 0.995 a la izquierda. Por 
lo tanto, usando la tabla A.3 nuevamente, z = 2.575 y el intervalo de confianza de 
99% es 


0.005 


2.6 — (2.575) (5) <p < 2.6 + (2.575) (52) 


о simplemente 


2.47 < u < 2.73. 


Ahora vemos que se requiere un intervalo más grande para estimar u con un mayor gra- 
do de confianza. 

El intervalo de confianza del 100(1 — @)% ofrece un estimado de la precisión de 
nuestra estimación puntual. Si 4 es realmente el valor central del intervalo, entonces х 
estima 4 sin error. La mayoría de las veces, sin embargo, х no será exactamente igual a 
H y la estimación puntual será errónea. La magnitud de este error será el valor absoluto 
de la diferencia entre u y х, de manera que podemos tener 100(1 – @)% de confianza en 
que esta diferencia no excederá а Za /2 77. Podemos ver esto fácilmente dibujando un 
diagrama de un intervalo de confianza hipotético, como el de la figura 9.4. 


xı 
ъ= 


X =Z an0 jn X+Za/20/VA 


Figura 9.4: Error en la estimación de и mediante х. 


Teorema 9.1: Si utilizamos х como una estimación de u, podemos tener 100(1 — 0)% de confianza en 
que el error no excederá а 20/27. 


En el ejemplo 9.2 tenemos una confianza del 95% en que la media muestral x = 2.6 
difiere de la media verdadera p en una cantidad menor que (1.96)(0.3)/ “6 =0.1 y 99% 
de confianza en que la diferencia es menor que (2.57510.3)/436 = 0.13. 

Con frecuencia queremos saber qué tan grande necesita ser una muestra para poder 
estar seguros de que el error al estimar u será menor que una cantidad específica e. Por 
medio del teorema 9.1 debemos elegir n de manera que 20/277 = €. Al resolver esta 
ecuación obtenemos la siguiente fórmula para n. 


Teorema 9.2: Si usamos Х como una estimación de u, podemos tener 100(1 — а)% de confianza en 
que el error no excederá a una cantidad específica e cuando el tamaño de la muestra sea 


2 ESE 
е 


Cuando resolvemos para la muestra con tamaño л, redondeamos todos los valores 
decimales al siguiente número entero. Si seguimos este principio, podemos estar segu- 
ros de que nuestro grado de confianza nunca caerá por debajo del 100(1 – @)%. 
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En términos estrictos, la fórmula del teorema 9.2 sólo será aplicable si se conoce la 
varianza de la población de la cual se seleccionó la muestra. Si no contamos con esa 
información, podríamos tomar una muestra preliminar de tamaño n > 30 para propor- 
cionar una estimación de с. Después, usando s como aproximación para © en el teore- 
ma 9.2, podemos determinar aproximadamente cuántas observaciones necesitamos para 
brindar el grado de precisión deseado. 


Ejemplo 9.3: 


Solución: 


¿Qué tan grande debe ser la muestra del ejemplo 9.2 si queremos tener 95% de confian- 
za en que nuestra estimación de р diferirá por menos de 0.05? 
La desviación estándar de la población es с = 0.3. Entonces, por medio del teorema 9.2, 


| (1.96)(0.3) 
ma aa 


2 
= 138.3. 
0.05 | dd 


Por lo tanto, podemos tener 95% de confianza en que una muestra aleatoria de tamaño 
139 proporcionará una estimación х que diferirá de y en una cantidad menor que 0.05. E 


Límites de confianza unilaterales 


Los intervalos de confianza y los límites de confianza resultantes que hasta ahora hemos 
analizado en realidad son bilaterales, es decir, tienen límites superior e inferior. Sin em- 
bargo, hay muchas aplicaciones en las que sólo se requiere un límite. Por ejemplo, si a 
un ingeniero le interesara determinar una medida de resistencia a la tensión, la informa- 
ción que más le ayudaría a lograr su objetivo sería la del límite inferior, ya que éste indi- 
ca el escenario del “peor caso”, es decir, el de la menor resistencia. Por otro lado, si se 
buscara determinar una medida para la cual un valor de yu relativamente grande no fuera 
redituable o deseable, entonces la medida que resultaría de interés sería la del límite de 
confianza superior. Un ejemplo en el que la medida del límite superior sería muy infor- 
mativa es el caso en el que se necesita hacer inferencias para determinar la composición 
media de mercurio en el agua de un río. 

Los límites de confianza unilaterales se desarrollan de la misma forma que los inter- 
valos bilaterales. Sin embargo, la fuente es un enunciado de probabilidad unilateral que 
utiliza el teorema del límite central: 


= < za) =1-a. 


Entonces, es posible manipular el enunciado de probabilidad de forma muy similar a 
como se hizo anteriormente para obtener 


P(p>X —2za0/yn)= 1-0. 
Una manipulación similar de P (E > —2a) =1-—Q da 
P(p<X + 2020/yn)=1-a. 


Como resultado, se obtienen los siguientes límites unilaterales superior e inferior. 


Límites 

de confianza 
unilaterales de р 
cuando se conoce 
el valor de о? 


Si X es la media de una muestra aleatoria de tamaño n a partir de una población con 
varianza 07, los límites de confianza unilaterales del 100(1 — а)% para и son dados por 


límite unilateral superior: Х +2a0/vyn; 


límite unilateral inferior: х —Zza0/yn. 
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Ejemplo 9.4: | En un experimento de pruebas psicológicas se seleccionan al azar 25 sujetos y se miden 
sus tiempos de reacción, en segundos, ante un estímulo particular. La experiencia sugie- 
re que la varianza en los tiempos de reacción ante los diferentes tipos de estímulos es de 
4 s? y que la distribución del tiempo de reacción es aproximadamente normal. El tiempo 
promedio para los sujetos fue de 6.2 segundos. Calcule un límite superior del 95% para 
el tiempo medio de reacción. 


Solución: Lo que da el límite superior del 95% es 


X +240/vyn = 6.2 + (1.645) /4/25 = 6.2 + 0.658 
= 6.858 segundos. 


En consecuencia, tenemos un 95% de confianza en que el tiempo promedio de reacción 
es menor que 6.858 segundos. JJ 


El caso en que se desconoce т 


Con frecuencia debemos tratar de estimar la media de una población sin conocer la va- 
rianza. El lector debería recordar que en el capítulo 8 aprendió que, si tenemos una 
muestra aleatoria a partir de una distribución normal, entonces la variable aleatoria 


_Х—ш 
= $/уп 


tiene una distribución £ de Student con n — 1 grados de libertad. Aquí 5 es la desviación 
estándar de la muestra. En esta situación, en la que se desconoce о, se puede utilizar T 
para construir un intervalo de confianza para u. El procedimiento es igual que cuando se 
conoce Ø, sólo que en este caso g se reemplaza con $ у la distribución normal estándar 
se reemplaza con la distribución /. Si nos remitimos a la figura 9.5, podemos afirmar que 


T 


P(Haj2 <T < tap) = 10, 
donde г ,, es el valor т con n— 1 grados de libertad, por arriba del cual encontramos una 


área de 0/2. Debido a la simetría, un área igual de œ/2 caerá а la izquierda de +, jr Al 
sustituir por T escribimos 


P | —t s РР =1-0 
а/ 2 5/ ут а/2 а * 


Al multiplicar cada término en la desigualdad por S//n y después restar X de cada tér- 
mino y multiplicar por —1, obtenemos 


= S = S 
P (х Бот и +) = | – а. 


Рага nuestra muestra aleatoria particular de tamaño n se calculan la media х y la desvia- 
ción estándar s, y se obtiene el siguiente intervalo de confianza 100(1 – @)% para pu. 
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1-а 
0/2 | а/2 А 
42 0 taj2 


Figura 9.5: Pty << іар) = 1-а. 


Intervalo de 
confianza para р 
cuando se 
desconoce т? 


Si х y s son la media y la desviación estándar de una muestra aleatoria de una población 
normal de la que se desconoce la varianza o°, un intervalo de confianza del 100(1 – a)% 
para р es 


5 5 
X = іа/2 <p <х + taj2 => 

yn yn 
donde г, р eS el valor £ con v = n – 1 grados de libertad que deja una área de 2/2 a la 
derecha. 


Hicimos una distinción entre los casos en 105 que se conoce су en los que se des- 
conoce calculando las estimaciones del intervalo de confianza. Deberíamos resaltar que 
para el caso en que se conoce Ø se utiliza el teorema del límite central, mientras que, para 
el caso en que se desconoce, se usa la distribución muestral de la variable aleatoria 7. Sin 
embargo, el uso de la distribución / se basa en la premisa de que el muestreo es de una 
distribución normal. Siempre que la forma de la distribución se aproxime a la de campa- 
na, se puede utilizar la distribución f para calcular los intervalos de confianza cuando se 
desconoce 0°, y se pueden esperar muy buenos resultados. 

Los límites de confianza unilaterales calculados para 4 con с desconocida son como 
el lector esperaría, a saber: 


= S S 
Х +Fta—= y Х = а=. 


ут ут 


Éstos son, respectivamente, los límites superior e inferior del 100(1 – a)%. Aquí t es el 
valor т que tiene una área с a la derecha. 


Ejemplo 9.5: |El contenido de ácido sulfúrico de 7 contenedores similares es de 9.8, 10.2, 10.4, 9.8, 


Solución: 


10.0, 10.2, y 9.6 litros. Calcule un intervalo de confianza del 95% para el contenido 
promedio de todos los contenedores suponiendo una distribución aproximadamente 
normal. 


La media muestral y la desviación estándar para los datos dados son 
x=100 y  s=0.283. 


Si usamos la tabla A.4, encontramos f p; = 2.447 para у = 6 grados de libertad. En 


consecuencia, el intervalo de confianza del 95% para и es 
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10.0 — (2.447) (7) < p < 10.0 + (2.447) ЕЗ | 


que se reduce a 9.74 < u < 10.26. J 


intervalo de confianza para una muestra grande 


Con frecuencia los estadísticos recomiendan que incluso cuando no sea posible suponer 
la normalidad, se desconozca Ø y n > 30, с se puede reemplazar con s para poder utilizar 
el intervalo de confianza 
a 5 
iban 
yn 
A menudo se hace referencia a esto como un intervalo de confianza para una muestra 
grande. La justificación para esto reside sólo en la presunción de que, con una mues- 
tra tan grande como 30 y una distribución de la población no muy sesgada, s estará muy 
cerca de la с verdadera y, de esta manera, el teorema del límite central continuará siendo 
válido. Se debería destacar que esto es sólo una aproximación y que la calidad de los 
resultados mejora a medida que aumenta el tamaño de la muestra. 


Ejemplo 9.6: | Se obtienen las calificaciones de matemáticas del Examen de Aptitudes Escolares (SAT, 


Solución: 


por sus siglas en inglés) de una muestra aleatoria de 500 estudiantes del último año de 
preparatoria del estado de Texas. Se calculan la media y la desviación estándar muestra- 
les, que son 501 y 112, respectivamente. Calcule un intervalo de confianza del 99% de la 
calificación promedio de matemáticas en el SAT para los estudiantes del último año de 
preparatoria del estado de Texas. 

Como el tamaño de la muestra es grande, es razonable utilizar la aproximación normal. 
Si utilizamos la tabla A.3, encontramos 2, yy, = 2.575. Por lo tanto, un intervalo de con- 
fianza del 99% para y es 


112 
501 + (2.575) (5) = 501 + 12.9, 


№500 


que da como resultado 488.1 < u < 513.9. Jl 


9.5 Error estándar de una estimación puntual 


Hicimos una distinción muy clara entre los objetivos de las estimaciones puntuales y las 
estimaciones del intervalo de confianza. Las primeras proporcionan un solo número que 
se extrae de un conjunto de datos experimentales, y las segundas proporcionan un inter- 
valo razonable para el parámetro, dados los datos experimentales; es decir, 1001 — 0)% 
de tales intervalos que se calcula “cubren” el parámetro. 

Estos dos métodos de estimación se relacionan entre sí. El elemento en común es la 
distribución muestral del estimador puntual. Considere, por ejemplo, el estimador X de 
p cuando se conoce с. Indicamos antes que una medida de la calidad de un estimador 
insesgado es su varianza. La varianza de X es 
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De esta forma, la desviación estándar de X o error estándar de X es 0) Уп. En términos 
simples, el error estándar de un estimador es su desviación estándar. Para el caso de X el 
límite de confianza que se calcula 


Х + 44/2 T se escribe como Y + Za/2 е.е.(Х), 
donde “e.e.” es el error estándar. El punto importante es que el ancho del intervalo de 
confianza de u depende de la calidad del estimador puntual a través de su error estándar. 
En el caso en que se desconoce су la muestra proviene de una distribución normal, 
s reemplaza a O y se incluye el error estándar estimado S//n. Por consiguiente, los lí- 
mites de confianza de u son: 


Límites de 
confianza para р 
cuando se 
desconoce т? 


$ 
х Si a =y + laJ2 ese) 
n 


De nuevo, el intervalo de confianza no es mejor (en términos de anchura) que la calidad 
de la estimación puntual, en este caso a través de su error estándar estimado. A menudo 
el software de computación se refiere a los errores estándar estimados simplemente 
como “errores estándar”. 

A medida que avanzamos a intervalos de confianza más complejos, prevalece el 
concepto de que el ancho de los intervalos de confianza se acorta cuando mejora la cali- 
dad de la estimación puntual correspondiente, aunque no siempre es tan sencillo como 
aquí se ilustra. Se puede argumentar que un intervalo de confianza es tan sólo una am- 
pliación de la estimación puntual para tomar en cuenta la exactitud de dicha estimación. 


9.6 Intervalos de predicción 


La estimación puntual y la estimación por intervalos de la media que se expusieron 
en las secciones 9.4 y 9.5 proporcionan buena información del parámetro desconocido u 
de una distribución normal, o de una distribución no normal a partir de la cual se toma 
una muestra grande. Algunas veces, además de la media de la población, el experimen- 
tador podría estar interesado en predecir el valor posible de una observación futura. 
Por ejemplo, en el control de calidad el experimentador podría necesitar utilizar los datos 
observados para predecir una nueva observación. Un proceso de manufactura de una 
pieza de metal se podría evaluar basándose en si la pieza cumple con las especificaciones 
de resistencia a la tensión. En ciertas ocasiones un cliente podría estar interesado en 
comprar una sola pieza. En este caso un intervalo de confianza de la resistencia media a 
la tensión no cubriría la información requerida. El cliente necesitaría una aseveración 
respecto a la incertidumbre de una sola observación. Este tipo de requerimiento se sa- 
tisface muy bien construyendo un intervalo de predicción. 

Es muy sencillo obtener un intervalo de predicción para las situaciones que hemos 
considerado hasta el momento. Suponga que la muestra aleatoria se tomó de una pobla- 
ción normal con media u desconocida y varianza о? conocida. Un estimador puntual 
natural de una nueva observación es X. En la sección 8.4 se aprendió que la varianza de 
X es а? /п. Sin embargo, para predecir una nueva observación no basta con explicar la 
variación debida a la estimación de la media, también tendríamos que explicar la varia- 
ción de una observación futura. A partir de la suposición sabemos que la varianza del 
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error aleatorio en una nueva observación es o°. El desarrollo de un intervalo de predic- 
ción se representa mejor empezando con una variable aleatoria normal х, — х, donde x, 
es la nueva observación у х se toma de la muestra. Como х, y х son independientes, sa- 


bemos que 
xo =x Хор 


5 м/а? + оп oy1+1/n 


es n(z; 0, 1). Como resultado, si utilizamos el enunciado de probabilidad 


P (—zaj2 <zZ< Za/2) =1-Q 


con el estadístico z anterior, y si colocamos x, en el centro del enunciado de probabili- 
dad, tenemos que la probabilidad de que ocurra el siguiente evento es 1 – 0: 


Х —2a4/2041+1/n < xo <Х +20/204 1 +1/n. 


Como resultado, el intervalo de predicción calculado se formaliza como sigue. 


Intervalo de 
predicción para 
una observación 
futura cuando se 
conoce т? 


Para una distribución normal de mediciones con media и desconocida y varianza о? 
conocida, un intervalo de predicción del 100(1 – 0)% de una observación futura x, es 


ï —Zaj20Vy 1 +1/n < xo < Х +20/204 1 +1/n, 


donde z, pes el valor z que deja una área de œ/2 a la derecha. 


Ejemplo 9.7: | Debido a la disminución en las tasas de interés el First Citizens Bank recibió muchas 


Solución: 


solicitudes para hipoteca. Una muestra reciente de 50 créditos hipotecarios dio como 
resultado un promedio en la cantidad de préstamos de $257,300. Suponga una desvia- 
ción estándar de la población de $25,000. En el caso del siguiente cliente que llena una 
solicitud de crédito hipotecario calcule un intervalo de predicción del 95% para la canti- 
dad del crédito. 

La predicción puntual de la cantidad del crédito del siguiente cliente es ¥ = $257,300. 
El valor z aquí es 2, „„ = 1.96. Por lo tanto, un intervalo de predicción del 95% para la 
cantidad de un crédito futuro es 


257,300 — (1.96)(25,000) 4/1 + 1/50 <x y < 257, 300 + (1.96)(25,000) 4/1 + 1/50, 


que produce el intervalo ($207,812.43, $306,787.57). J 

El intervalo de predicción proporciona un buen estimado de la ubicación de una 
observación futura, el cual es muy diferente del estimado del valor promedio de la mues- 
tra. Debe advertirse que la variación de esta predicción es la suma de la variación debida 
a una estimación de la media y la variación de una sola observación. Sin embargo, como 
antes, consideramos primero el caso en el que se conoce la varianza. En el caso en que 
se desconoce la varianza también es importante tratar con el intervalo de predicción 
de una observación futura. De hecho, en este caso se podría utilizar una distribución t de 
Student, como se describe en el siguiente resultado. Aquí la distribución normal simple- 
mente se reemplaza con la distribución t. 
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Intervalo de 
predicción de una 
observación 
futura cuando se 
desconoce т? 


Para una distribución normal de mediciones cuando la media и y la varianza ©? se des- 
conocen, un intervalo de predicción del 100(1 – œ)% de una observación futura х, es 


E —tapas y 1 + 1/n <xo < +tap25 y 1+1/n, 


donde £, j es el valor £ con v = n — 1 grados de libertad, que deja una área de 02/2 a la 
derecha. 


También se pueden utilizar intervalos de predicción unilaterales. Los límites de pre- 
dicción superiores se aplican en casos en los que es necesario enfocarse en observacio- 
nes futuras grandes. El interés por observaciones pequeñas futuras requiere utilizar 
límites de predicción más bajos. El límite superior es dado por 


Хх +tasyl+1/n 


y el límite inferior por 


Хх —tasyl+1/n. 


Ejemplo 9.8: [Оп inspector de alimentos seleccionó aleatoriamente 30 paquetes de carne de res 95% 


Solución: 


magra. La muestra dio como resultado una media de 96.2% con una desviación estándar 
muestral de 0.8%. Calcule un intervalo de predicción del 99% para la condición baja en 
grasa de un paquete nuevo. Suponga normalidad. 

Рага v = 29 grados de libertad, f, „s = 2.756. Por lo tanto, un intervalo de predicción del 
99% para una observación nueva x, es 


/ 1 / 1 
96.2 — (2.756)(0.8)4/1 + 30 < xo < 96.2 + (2.756)(0.8)4/1 + 30 


que se reduce a (93.96, 98.44). JJ 


Uso de límites de predicción para detectar valores extremos 


Hasta el momento hemos puesto poca atención al concepto de valores extremos u ob- 
servaciones aberrantes. La mayoría de los investigadores científicos son muy sensibles a 
la existencia de observaciones de valores extremos, también llamados datos defectuosos 
o “malos”. En el capítulo 12 profundizaremos en el estudio de este concepto. Sin em- 
bargo, nos interesa considerarlos aquí porque la detección de los valores extremos está 
estrechamente relacionada con los intervalos de predicción. 

Para nuestros propósitos nos conviene considerar que una observación extrema es 
una que proviene de una población con una media diferente a la que determina el resto 
de la muestra de tamaño n que se está estudiando. El intervalo de predicción produce un 
límite que “cubre” una sola observación futura con probabilidad 1 — о, si ésta proviene 
de la población de la que se tomó la muestra. Por lo tanto, una metodología para detectar 
valores extremos implica la regla de que una observación es un valor extremo si cae 
fuera del intervalo de predicción calculado sin incluir la observación cuestionable 
en la muestra. Como resultado, para el intervalo de predicción del ejemplo 9.8, en el 
caso de los paquetes de carne, la observación que se obtiene al medir un nuevo paquete 
y encontrar que su contenido libre de grasa está fuera del intervalo (93.96, 98.44) se 
podría considerar como un valor extremo. 
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9.7 Límites de tolerancia 


Como vimos en la sección 9.6, el científico o el ingeniero podrían estar menos interesa- 
dos en estimar parámetros que en obtener información sobre el lugar en el que caería una 
observación o medición individual. Este tipo de situaciones requiere intervalos de pre- 
dicción. Sin embargo, existe un tercer tipo de intervalo que es útil en muchas aplicacio- 
nes. Una vez más, suponga que el interés se centra en torno a la fabricación de la pieza 
de un componente y que existen especificaciones sobre una dimensión de esa parte. 
Además, la media de esa dimensión no es tan importante. Sin embargo, a diferencia del 
escenario de la sección 9.6, se podría estar menos interesado en una sola observación y 
más en el lugar en el que cae la mayoría de la población. Si las especificaciones del pro- 
ceso son importantes, el administrador del proceso se interesará en el desempeño a largo 
plazo, no en la siguiente observación. Debemos tratar de determinar los límites que, en 
cierto sentido probabilístico, “cubren” los valores en la población, es decir, los valores 
medidos de la dimensión. 

Un método para establecer el límite deseado consiste en determinar un intervalo de 
confianza sobre una proporción fija de las mediciones. Esto se comprende mejor visua- 
lizando una situación en la que se realiza un muestreo aleatorio de una distribución 
normal con media conocida yu y varianza o°. Evidentemente, un límite que cubre el 95% 
central de la población de observaciones es 


и + 1.960. 


A esto se le llama intervalo de tolerancia y, en realidad, su cobertura del 95% de las 
observaciones medidas es exacta. Sin embargo, en la práctica rara vez se conocen H y о; 
por consiguiente, el usuario debe aplicar 


х +5. 


Ahora bien, el intervalo es, desde luego, una variable aleatoria, por Іо tanto, la cobertura 
de una proporción de la población por el intervalo no es exacta. Como resultado, se debe 
usar un intervalo de confianza del 100(1 — 7)%, ya que no se puede esperar que х + ks 
cubra cualquier proporción específica todo el tiempo. Lo anterior nos lleva a la siguiente 
definición. 


Límites de 
tolerancia 


Para una distribución normal de mediciones en la que se desconoce la media y y la des- 
viación estándar с, los límites de tolerancia son dados por х + ks, donde k se determina 
de tal manera que se pueda estar seguro, con un 100(1 ~ 7)% de confianza, de que los 
límites dados contienen al menos la proporción 1 ~ а de las mediciones. 


La tabla A.7 ofrece valores de К para 1 – о = 0.90, 0.95, 0.99; y = 0.05, 0.01; y para 
valores seleccionados de n de 2 a 300. 


Ejemplo 9.9: | Considere el ejemplo 9.8. Con la información dada calcule un intervalo de tolerancia que 


Solución: 


proporcione límites bilaterales del 95% sobre el 90% de la distribución de paquetes de 
carne 95% magra. Suponga que los datos provienen de una distribución aproximada- 
mente normal. 

Del ejemplo 9.8, recuerde que n = 30, que la media muestral es de 96.2% y que la des- 
viación estándar muestral es de 0.8%. De la tabla A.7, К = 2.14. Si utilizamos 


х Кз = 96.2 + (2.14)(0.8), 
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encontramos que los límites inferior y superior son de 94.5 у de 97.9. 
Tenemos 95% de confianza en que el rango anterior cubre el 90% central de la dis- 
tribución de paquetes de carne de res 95% magra. 


Diferencia entre intervalos de confianza, intervalos 
de predicción e intervalos de tolerancia 


Es importante resaltar la diferencia entre los tres tipos de intervalos que se estudiaron e 
ilustraron en las secciones anteriores. Los cálculos son sencillos, pero la interpretación 
podría resultar confusa. En aplicaciones de la vida real tales intervalos no son intercam- 
biables, ya que sus interpretaciones son muy diferentes. 

En el caso de los intervalos de confianza sólo se pone atención en la media de la 
población. Por ejemplo, el ejercicio 9.13 de la página 283 se refiere a un proceso de 
ingeniería que produce alfileres para costura. Se establece una especificación sobre la 
dureza de Rockwell por debajo de la cual el cliente no aceptará ningún alfiler. En este 
caso un parámetro de la población debe tener poca relevancia. Es importante que el 
ingeniero sepa en dónde van a estar la mayoría de los valores de la dureza de Rockwell. 
Por consiguiente, se deberían utilizar los límites de tolerancia. Seguramente, al adminis- 
trador le agradará saber que los límites de tolerancia en cualquier producto del proceso 
son más rigurosos que las especificaciones para el propio proceso. 

Es verdad que la interpretación del límite de tolerancia se relaciona hasta cierto 
punto con el intervalo de confianza. El intervalo de tolerancia del 100(1 – @)% sobre, 
digamos, la proporción 0.95, se podría considerar como un intervalo de confianza sobre 
el 95% intermedio de la distribución normal correspondiente. Los límites de toleran- 
cia unilaterales también son relevantes. En el caso del problema de dureza de Rockwell 
se desearía tener un límite inferior de la forma х — ks, tal que se tenga un 99% de con- 
fianza en que al menos 99% de los valores de la dureza de Rockwell excederán al valor 
calculado. 

Los intervalos de predicción se pueden aplicar cuando es importante determinar un 
límite para un solo valor. Aquí la media no es la cuestión, ni tampoco la ubicación de la 
mayoría de la población, lo que se requiere, más bien, es la ubicación de una sola nueva 
observación. 


Estudio de caso 9.1: | Calidad de una máquina. Una máquina produce piezas de metal que tienen forma 
cilíndrica. Se toma una muestra de tales piezas y se encuentra que los diámetros son 
1.01, 0.97. 1.03, 1.04, 0.99, 0.98, 0.99, 1.01 y 1.03 centímetros. Utilice estos datos para 
calcular tres tipos de intervalos y hacer interpretaciones que ilustren las diferencias entre 
ellos en el contexto del sistema. Para todos los cálculos suponga una distribución aproxi- 
madamente normal. La media muestral y la desviación estándar para los datos dados son 
x = 1.0056 y s = 0.0246. 


a) Calcule un intervalo de confianza del 99% sobre la media del diámetro. 


b) Calcule un intervalo de predicción del 99% sobre el diámetro medido de una sola 
pieza de metal tomada de la máquina. 


c) Calcule los límites de tolerancia del 99% que contengan 95% de las piezas de metal 
producidas por esta máquina. 


Solución: a) El intervalo de confianza del 99% para la media del diámetro está dado por 


х + 1o.005 5/ үп = 1.0056 + (3.355)(0.0246/3) = 1.0056 + 0.0275. 
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Por lo tanto, los límites de confianza del 99% son 0.9781 y 1.0331. 


b) El intervalo de predicción del 99% para una futura observación está dado por 


х +to0ss y 1 +1/n = 1.0056 + (3.35510.0246) /1 + 1/9, 


donde los límites son 0.9186 y 1.0926. 


c) De la tabla A.7, paran = 9, 1-—y=0.99, y 1— о = 0.95, obtenemos k = 4.550 para 
los límites bilaterales. Por lo tanto, los límites de tolerancia del 99% son dados por 


х +ks = 1.0056 + (4.550)(0.0246), 


donde los límites son 0.8937 y 1.1175. Tenemos un 99% de confianza en que el in- 
tervalo de tolerancia de 0.8937 a 1.1175 contendrá el 95% central de la distribución 
de diámetros producidos. 


Este estudio de caso ilustra que los tres tipos de límites pueden conducir a resultados 
muy diferentes, aunque todos son límites del 99%. En el caso del intervalo de confianza 
sobre la media, el 99% de estos intervalos cubre la media del diámetro de la población. 
Por lo tanto, decimos que tenemos un 99% de confianza en que la media del diámetro 
producido por el proceso se encuentra entre 0.9781 y 1.0331 centímetros. Se hace hin- 
capié en la media y se pone poco interés en una sola lectura o en la naturaleza general de 
la distribución de diámetros en la población. En lo que se refiere a los límites de predic- 
ción, los límites 0.9186 y 1.0926 se basan en la distribución de una sola pieza “nueva” de 
metal tomada del proceso, y nuevamente el 99% de estos límites cubren el diámetro 
de una nueva pieza medida. Por otro lado, como se sugirió en la sección anterior, los lí- 
mites de tolerancia le dan al ingeniero una idea de en qué parte de la población se loca- 
liza la “mayoría”, digamos el 95% central, de los diámetros de las piezas medidas. Los 
límites de tolerancia del 99%, 0.8937 y 1.1175 difieren mucho de los otros dos límites. 
Si esos límites le parecen demasiado anchos al ingeniero, esto se reflejará de forma ne- 
gativa en la calidad del proceso. Por otro lado, si los límites representan un resultado 
deseable, el ingeniero podría concluir que la mayoría (95% en este caso) de los diáme- 
tros se encuentran dentro de un rango adecuado. De nuevo, se podría hacer una interpre- 
tación del intervalo de confianza, a saber, el 99% de esos límites calculados cubrirán el 
95% intermedio de la población de diámetros. J 


de 40 horas. Si una muestra de 30 bombillas tiene una 


9.1 Un investigador de la UCLA afirma que la esperan- 
za de vida de los ratones se puede extender hasta en 25% 
cuando se reduce aproximadamente 40% de las calorías 
de su dieta desde el momento en que son destetados. La 
dieta restringida se enriquece hasta niveles normales con 
vitaminas y proteínas. Si se supone que a partir de estu- 
dios previos se sabe que с = 5.8 meses, ¿cuántos ratones 
se deberían incluir en la muestra para tener un 99% de 
confianza en que la vida media esperada de la muestra 
estará dentro de 2 meses a partir de la media de la pobla- 
ción para todos los ratones sujetos a la dieta reducida? 


9.2 Una empresa de material eléctrico fabrica bombi- 
llas que tienen una duración distribuida de forma 
aproximadamente normal, con una desviación estándar 


duración promedio de 780 horas, calcule un intervalo 
de confianza del 96% para la media de la población de 
todas las bombillas producidas por esta empresa. 


9.3 Muchos pacientes con problemas del corazón tie- 
nen un marcapasos para controlar su ritmo cardiaco. El 
marcapasos tiene montado un módulo conector de plás- 
tico en la parte superior. Suponga una desviación 
estándar de 0.0015 pulgadas y una distribución aproxi- 
madamente normal, y con base en esto calcule un 
intervalo de confianza del 95% para la media de la pro- 
fundidad de todos los módulos conectores fabricados 
por cierta empresa. Una muestra aleatoria de 75 módu- 
los tiene una profundidad promedio de 0.310 pulgadas. 


Ejercicios 


9.4 Las estaturas de una muestra aleatoria de 50 estu- 
diantes universitarios tienen una media de 174.5 centí- 
metros y una desviación estándar de 6.9 centímetros. 
a) Construya un intervalo de confianza del 98% para la 
estatura media de todos los estudiantes universitarios. 
b) ¿Qué podemos afirmar con una confianza del 98% 
acerca del posible tamaño de nuestro error, si esti- 
mamos que la estatura media de todos los estu- 
diantes universitarios es de 174.5 centímetros? 


9.5 Una muestra aleatoria de 100 propietarios de au- 
tomóviles del estado de Virginia revela que éstos con- 
ducen su automóvil, en promedio, 23,500 kilómetros 
por año, con una desviación estándar de 3900 kilóme- 
tros. Suponga que la distribución de las mediciones 
es aproximadamente normal. 

a) Construya un intervalo de confianza del 99% para el 
número promedio de kilómetros que un propietario 
de un automóvil conduce anualmente en Virginia. 

b) ¿Qué podemos afirmar con un 99% de confianza 
acerca del posible tamaño del error, si estimamos 
que los propietarios de automóviles de Virginia con- 
ducen un promedio de 23,500 kilómetros por año? 


9.6 ¿Qué tan grande debe ser la muestra en el ejerci- 
cio 9.2 si deseamos tener un 96% de confianza en que 
nuestra media muestral estará dentro de 10 horas a par- 
tir de la media verdadera? 


9.7 De qué tamaño debe ser la muestra еп el ejerci- 
cio 9.3 si deseamos tener un 95% de confianza en que 
nuestra media muestral estará dentro de un 0.0005 de 
pulgada de la media verdadera? 


9.8 Un experto en eficiencia desea determinar el 
tiempo promedio que toma perforar tres hoyos en cierta 
placa metálica. ¿De qué tamaño debe ser una muestra 
para tener un 95% de confianza en que esta media 
muestral estará dentro de 15 segundos de la media ver- 
dadera? Suponga que por estudios previos se sabe que 
с = 40 segundos. 


9.9 Según estudios realizados por el doctor W. H. 
Bowen, del Instituto Nacional de Salud, y por el doctor 
J. Yudben, profesor de nutrición y dietética de la Uni- 
versidad de Londres, el consumo regular de cereales 
preendulzados contribuye al deterioro de los dientes, a 
las enfermedades cardiacas y a otras enfermedades de- 
generativas. En una muestra aleatoria de 20 porciones 
sencillas similares del cereal Alpha-Bits, el contenido 
promedio de azúcar era de 11.3 gramos con una desvia- 
ción estándar de 2.45 gramos. Suponga que el conteni- 
do de azúcar está distribuido normalmente y con base 
en esto construya un intervalo de confianza de 95% 
para el contenido medio de azúcar de porciones senci- 
llas de Alpha-Bits. 


9.10 Las integrantes de una muestra aleatoria de 12 
graduadas de cierta escuela para secretarias teclearon 
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un promedio de 79.3 palabras por minuto, con una des- 
viación estándar de 7.8 palabras por minuto. Suponga 
una distribución normal para el número de palabras que 
teclean por minuto y con base en esto calcule un inter- 
valo de confianza del 95% para el número promedio de 
palabras que teclean todas las graduadas de esta escuela. 


9.11 Una máquina produce piezas metálicas de forma 
cilíndrica. Se toma una muestra de las piezas y los diá- 
metros son 1.01, 0.97, 1.03, 1.04, 0.99, 0.98, 0.99, 1.01 
y 1.03 centímetros. Calcule un intervalo de confianza 
del 99% para la media del diámetro de las piezas que se 
manufacturan con esta máquina. Suponga una distribu- 
ción aproximadamente normal. 


9.12 Una muestra aleatoria de 10 barras energéticas de 
chocolate de cierta marca tiene, en promedio, 230 calo- 
rías por barra y una desviación estándar de 15 calorías. 
Construya un intervalo de confianza del 99% para el 
contenido medio verdadero de calorías de esta marca de 
barras energéticas de chocolate. Suponga que la distribu- 
ción del contenido calórico es aproximadamente normal. 


9.13 En un estudio para determinar la dureza de 
Rockwell en la cabeza de alfileres para costura se toma 
una muestra aleatoria de 12. Se toman mediciones de la 
dureza de Rockwell para cada una de las 12 cabezas y 
se obtiene un valor promedio de 48.50, con una desvia- 
ción estándar muestral de 1.5. Suponga que las medicio- 
nes se distribuyen de forma normal y con base en esto 
construya un intervalo de confianza de 90% para la du- 
reza media de Rockwell. 


9.14 Se registran las siguientes mediciones del tiempo 
de secado, en horas, de cierta marca de pintura vinílica: 


34 25 48 29 3.6 
28 33 56 37 28 
44 40 52 30 4.8 


Suponga que las mediciones representan una muestra 
aleatoria de una población normal y con base en esto 
calcule el intervalo de predicción del 95% para el tiem- 
po de secado de la siguiente prueba de pintura. 


9.15 Remítase al ejercicio 9.5 y construya un interva- 
lo de predicción del 99% para los kilómetros que viaja 
anualmente el propietario de un automóvil en Virginia. 


9.16 Considere el ejercicio 9.10 y calcule el intervalo 
de predicción del 95% para el siguiente número obser- 
vado de palabras por minuto tecleadas por una gradua- 
da de la escuela de secretarias. 


9.17 Considere el ejercicio 9.9 y calcule un intervalo 
de predicción del 95% para el contenido de azúcar de la 
siguiente porción de cereal Alpha-Bits. 


9.18 Remítase al ejercicio 9.13 y construya un inter- 
valo de tolerancia del 95% que contenga el 90% de las 
mediciones. 
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9.19 Una muestra aleatoria de 25 tabletas de aspirina 
con antiácido contiene, en promedio, 325.05 mg de as- 
pirina en cada tableta, con una desviación estándar de 
0.5 mg. Calcule los límites de tolerancia del 95% que 
contendrán 90% del contenido de aspirina para esta 
marca. Suponga que el contenido de aspirina se distri- 
buye normalmente. 


9.20 Considere la situación del ejercicio 9.11. Aun- 
que la estimación de la media del diámetro es impor- 
tante, no es ni con mucho tan importante como intentar 
determinar la ubicación de la mayoría de la distribu- 
ción de los diámetros. Calcule los límites de tolerancia 
del 95% que contengan el 95% de los diámetros. 


9.21 En un estudio realizado por el Departamento de 
Zoología del Virginia Tech con el fin de conocer la can- 
tidad de ortofósforo en el río, se recolectaron 15 “mues- 
tras” de agua en una determinada estación ubicada en 
el río James. La concentración del químico se midió 
en miligramos por litro. Suponga que la media en la 
estación de muestreo no es tan importante como la dis- 
tribución de las concentraciones del químico en los ex- 
tremos superiores. El interés se centra en saber si las 
concentraciones en estos extremos son demasiado ele- 
vadas. Las lecturas de las 15 muestras de agua propor- 
cionaron una media muestral de 3.84 miligramos por 
litro y una desviación estándar muestral de 3.07 mili- 
gramos por litro. Suponga que las lecturas son una 
muestra aleatoria de una distribución normal. Calcule 
un intervalo de predicción (límite de predicción supe- 
rior del 95%) y un límite de tolerancia (un límite de 
tolerancia superior del 95% que excede al 95% de la 
población de valores). Interprete ambos límites, es de- 
cir, especifique qué indica cada uno acerca de los extre- 
mos superiores de la distribución de ortofósforo en la 
estación de muestreo. 


9.22 Se están estudiando las propiedades de resisten- 
cia a la tensión de un determinado tipo de hilo. Con ese 
fin se prueban 50 piezas en condiciones similares y los 
resultados que se obtienen revelan una resistencia a la 
tensión promedio de 78.3 kilogramos y una desviación 
estándar de 5.6 kilogramos. Suponga que la resistencia 
a la tensión tiene una distribución normal y con base en 
esto calcule un límite de predicción inferior al 95% de 
un solo valor observado de resistencia a la tensión. 
Además, determine un límite inferior de tolerancia del 
95% que sea excedido por el 99% de los valores de re- 
sistencia a la tensión. 


9.23 Remítase al ejercicio 9.22. ¿Por qué las 1/2 canti- 
dades solicitadas en el ejercicio parecen ser más importan- 
tes para el fabricante del hilo que, por ejemplo, un 
intervalo de confianza en la resistencia media a la tensión? 


9.24 Remítase una vez más al ejercicio 9.22. Supon- 
ga que un comprador del hilo especifica que éste debe 
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tener una resistencia a la tensión de por lo menos 62 ki- 
logramos. El fabricante estará satisfecho si la cantidad 
de piezas producidas que no cumplen la especificación 
no excede al 5%. ¿Hay alguna razón para preocuparse? 
Esta vez utilice un límite de tolerancia unilateral del 
99% que sea excedido por el 95% de los valores de re- 
sistencia a la tensión. 


9.25 Considere las mediciones del tiempo de secado 
del ejercicio 9.14. Suponga que las 15 observaciones 
en el conjunto de datos también incluyen un decimo- 
sexto valor de 6.9 horas. En el contexto de las 15 obser- 
vaciones originales, ¿el valor decimosexto es un valor 
extremo? Muestre el procedimiento. 
9.26 Considere los datos del ejercicio 9.13. Suponga 
que el fabricante de los alfileres insiste en que la dureza 
de Rockwell del producto es menor o igual que 44.0 
sólo un 5% de las veces. ¿Cuál es su reacción? Utilice 
un cálculo de un límite de tolerancia como la base de su 
veredicto. 
9.27 Considere la situación del estudio de caso 9.1 de 
la página 281, con una muestra más grande de piezas 
metálicas. Los diámetros son los siguientes: 1.01, 0.97, 
1.03, 1.04, 0.99, 0.98, 1.01, 1.03, 0.99, 1.00, 1.00, 0.99, 
0.98, 1.01, 1.02, 0.99 centímetros. Nuevamente puede 
suponer una distribución normal. Haga lo siguiente y 
compare sus resultados con los del estudio de caso. 
Analice en qué difieren y por qué. 
a) Calcule un intervalo de confianza del 99% de la 
media del diámetro. 
b) Calcule un intervalo de predicción del 99% en la 
medición del siguiente diámetro. 
c) Calcule un intervalo de tolerancia del 99% para la 
cobertura del 95% central de la distribución de 
diámetros. 


9.28 En la sección 9.3 destacamos el concepto del 
“estimador más eficaz” comparando la varianza de dos 
estimadores insesgados O, y O,. Sin embargo, esto no 
toma en cuenta el sesgo en el caso en que uno o ambos 
estimadores no son sesgados. Considere la cantidad 
EME = Е(Ө – Ө), 

donde EME denota el error cuadrático medio. El 
error cuadrático medio a menudo se utiliza para com- 
parar dos estimadores ©, y O, de Ө, cuando uno o am- 
bos no son sesgados porque i) es intuitivamente 
razonable y ii) se toma en cuenta para el sesgo. De- 
muestre que el EME se puede escribir como 


ЕМЕ= Е[Ө — Е(©)] + E(Ô -oF 
=Var (Ó) + [sesgo (OP. 
9.29 Definamos S? = Y (X, —X ? /n. 


Demuestre que кч 
E(S”) = [(n — 1)/п]о”, 
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у, en consecuencia, que $° es un estimador sesgado 
para o°. 

9.30 Considere 5”, el estimador de a”, del ejercicio 
9.29. Con frecuencia los analistas utilizan $? en lugar 


de dividir X` (X; — X) entre n- 1, los grados de liber- 
i=l 
tad en la muestra. 


a) ¿Cuál es el sesgo de 5”? 
b) Demuestre que el sesgo de $? se aproxima a cero 
a medida que п — оо. 


9.31 Si X es una variable aleatoria binomial, demues- 
tre que 
a) Р= Х/п es un estimador insesgado de р; 


b) р Х+ me es un estimador sesgado de p. 
п+ yn 
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9.32 Demuestre que el estimador P’ del ejercicio 
9.31b) se vuelve no sesgado a medida que п — оо. 


9.33 Compare 5? y S” (véase el ejercicio 9.29), los 
dos estimadores de o°, para determinar cuál es más efi- 
caz. Suponga que estos estimadores se obtienen usando 
Х,, Х,,..., Х,, las variables aleatorias independientes de 
nG; ТА 0). ¿Cuál es el estimador más eficaz si se consi- 
dera sólo la varianza de los estimadores? [Sugerencia: 
Utilice el teorema 8.4 y el hecho de que la varianza de 
Х? es 2v, de la sección 6.7.] 


9.34 Considere el ejercicio 9.33. Utilice el EME que 
se estudió en el ejercicio 9.28 para determinar qué esti- 
mador es más eficaz. Escriba 

EME (S°) 

EME (82) ` 


9.8 Dos muestras: estimación de la diferencia entre dos medias 


Si tenemos dos poblaciones con medias 4, y H,, y varianzas oi y 05, в 


el estadístico que da un estimador puntual de la diferencia entre 4, y 4, es X, — 
lo tanto, para obtener una estimación puntual de ш, — H, 


> Por 
se seleccionan des вы Ба 


aleatorias independientes, una de cada población, de tamaños n, y n,, y se calcula х, — X,, 
la diferencia de las medias muestrales. Evidentemente, debemos considetár la distribu- 


ción muestral de X — X. 


De acuerdo con el teorema 8.3, podemos esperar que la distribución muestral de 
-X esté distribuida de forma aproximadamente normal con media ру у, = Ш — Ha 


y .. estándar Oz ,_x, 


o? /ni +03/n2. Por lo tanto, podemos asegurar, 


con una probabilidad de 1 — о, que la variable normal estándar 


Z= 


(Xı — X2) — (ш 


— m) 


мот /т +03/n2 


caerá entre =z, pa Y ajo Si nos remitimos una vez más a la figura 9.2, escribimos 


P(—Za/2 <Z < Za/2) =1-Q 


Al sustituir para Z, establecemos de manera equivalente que 


— ш) 


Р (or 2 (Xı —X2) — (ш 


y 0 /ni + 03/n2 


<a) =1-a0 


que conduce al siguiente intervalo de confianza del 100(1 – 0)% para p, — p,. 


Intervalo de 
confianza para 
L, = H, cuando 

se conocen 
оту о» 


Si Х| y х, son las medias de muestras ео independientes de tamaños n, y n,, 
de poblaciones que tienen varianzas conocidas сі y a, respectivamente, un intervalo de 
confianza del 100(1 – 0)% para pu, – p, es dado por 


2 n о Й А 0? 
(51 #2) – 20720 = + 2 < m =p < (41 — X2) + Za/2 AZ, 
n1 пэ n2 


donde z, pes el valor z que deja una área de 2/2 a la derecha. 
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El grado de confianza es exacto cuando las muestras se seleccionan de poblaciones 
normales. Para poblaciones no normales el teorema del límite central permite una buena 
aproximación para muestras de tamaño razonable. 


Las condiciones experimentales y la unidad experimental 


Para el caso en que se necesita estimar un intervalo de confianza sobre la diferencia 
entre dos medias se requiere considerar las condiciones experimentales durante el pro- 
ceso de recolección de datos. Se supone que tenemos dos muestras aleatorias indepen- 
dientes de distribuciones con medias 4, y џ,, respectivamente. Es importante que las 
condiciones experimentales se parezcan al ideal descrito por las suposiciones tanto 
como sea posible. Con mucha frecuencia el experimentador debería planear la estrategia 
del experimento de acuerdo con esto. Para casi cualquier estudio de este tipo existe una 
unidad experimental, que es la parte del experimento que produce el error experimental 
y genera la varianza de la población que denominamos o°. En un estudio farmacológico 
la unidad experimental es el paciente o el sujeto. En un experimento de agricultura 
puede ser una superficie de tierra. En un experimento químico puede ser una cantidad 
de materias primas. Es importante que las diferencias entre tales unidades tengan un 
impacto mínimo sobre los resultados. El experimentador tendrá un grado de seguridad 
de que las unidades experimentales no sesgarán los resultados si las condiciones 
que definen a las dos poblaciones se asignan al azar a las unidades experimentales. En 
los siguientes capítulos acerca de la prueba de hipótesis nos volveremos a concentrar en 
la aleatorización. 


Ejemplo 9.10: | $е llevó a cabo un experimento donde se compararon dos tipos de motores, el A y el 


Solución: 


B. Se midió el rendimiento de combustible en millas por galón. Se realizaron 50 experi- 
mentos con el motor tipo A y 75 con el motor tipo B. La gasolina utilizada y las demás 
condiciones se mantuvieron constantes. El rendimiento promedio de gasolina para el 
motor A fue de 36 millas por galón y el promedio para el motor B fue de 42 millas por 
galón. Calcule un intervalo de confianza del 96% sobre ш, — H, donde р, y Hp corres- 
ponden a la media de la población del rendimiento de millas por galón para los motores 
A y B, respectivamente. Suponga que las desviaciones estándar de la población son 6 y 
8 para los motores A y B, respectivamente. 


La estimación puntual de pu, — H, es X, — ¥, = 42 — 36 = 6. Si usamos а = 0.04, obte- 
nemos 2, = 2.05 de la tabla A.3. Por lo tanto, sustituyendo en la fórmula anterior, el 
intervalo de confianza del 96% es 


64 36 64 36 
=Ыйзү зк - 2,05\/ м 


o simplemente 3.43 < u, — H, < 8.57. J 

Este procedimiento para estimar la diferencia entre dos medias se aplica si se cono- 
cen ol y оі, Si las varianzas по se conocen y las dos distribuciones implicadas son 
aproximadamente normales, la distribución / resulta implicada como en el caso de una 
sola muestra. Si no se está dispuesto a suponer normalidad, muestras grandes (digamos 
mayores que 30) permitirán usar s, y s, en lugar de O, y O,, respectivamente, con el fun- 
damento de que s, ~ €, y s, ~ с,. De nuevo, por supuesto, el intervalo de confianza es 
aproximado. 
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Varianzas desconocidas pero iguales 


Considere el caso donde se desconocen сі y оЎ. 51 с = o} = о? obtenemos una va- 
riable normal estándar de la forma 
(XA —X2) — (ш — m) 
Pay + A/m) 
De acuerdo con el teorema 8.4, las dos variables aleatorias 
(пу — 195? (пә — 1)$2 
с? As o? 


tienen distribuciones chi cuadrada соп n, — 1 y n, – 1 grados de libertad, respectivamen- 
te. Además, son variables chi cuadrada independientes, ya que las muestras aleatorias se 
seleccionaron de forma independiente. En consecuencia, su suma 


_ (и 080 ү (пә — 1)82 _ mu- 057 + (по — 1)82 
Е с? о? o? 
tiene una distribución chi cuadrada соп v = n, + n, – 2 grados de libertad. 


Como se puede demostrar que las expresiones anteriores para Z y V son indepen- 
dientes, del teorema 8.5 se sigue que el estadístico 


01-Х) - (m - m) AA 


о? [(1/п) + ( 1/п»)] о?(пу +n —2) 


tiene la distribución £ con v = п, + п„— 2 grados de libertad. 

Se puede obtener una estimación puntual de la varianza común desconocida т? 
agrupando las varianzas muestrales. Si representamos con 52 р al estimador agrupado, 
obtenemos lo siguiente, 


Estimado 
agrupado 
de la varianza 


(nı — DS? +(n, — 1)53 
ni +n2-2 ` 


2 — 
Sp 


Al sustituir s: en el estadístico T, obtenemos la forma menos engorrosa: 
a (X1 —X 2) — (ш — M2) 
Sp V (1/n1) + (1/n2) 
Si usamos el estadístico T, tenemos 
P(Haj2 <T< la/2) =1-а 


donde г, es el valor 1 con n, + л, – 2 grados de libertad, por arriba del cual encontramos 
una área de 0/2. Al sustituir por T en la desigualdad, escribimos 


(Х| (Xy —X2) — (ш — m) Шо) < 


Soy (1/n1) + (1/n2) 


Después de realizar las manipulaciones matemáticas de costumbre, se calculan la dife- 
rencia de las medias muestrales х — X, y la varianza agrupada, y se obtiene el siguiente 
intervalo de confianza del 100(1 — 0)% рага ш, – и. 


Р | іар < H— === =1-@ 
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Se observa con шй que el valor de 52 р es un promedio ponderado de las dos 
varianzas muestrales s? y 52, donde los pesos son los grados de libertad. 


Intervalo de 


confianza para 


p,- р, 01 = 03 


cuando se 
desconocen 
ambas varianzas 


Si x, y х, son las medias de muestras aleatorias independientes con tamaños п, y п„ 
respectivamente, tomadas de poblaciones más o menos normales con varianzas iguales 
pero desconocidas, un intervalo de confianza del 100(1 – @)% para p, – 1, es dado por 


1 1 1 1 
Mi= tahia lim e E Ш < (Х| —X2) + la/25p a 
n2 n2 


donde s, es la estimación agrupada de la desviación estándar de la población y t aj? es el 
valor і con у = n, + n,—2 grados de libertad, que deja una área de 2/2 a la derecha. 


Ejemplo 9.11: | En el artículo “Estructura comunitaria de los macroinvertebrados como un indicador de 


Solución: 


la contaminación de minas ácidas”, publicado en el Journal of Environmental Pollution, 
se informa sobre una investigación realizada en Cane Creek, Alabama, para determinar 
la relación entre parámetros fisioquímicos seleccionados y diversas mediciones de la 
estructura de la comunidad de macroinvertebrados. Una faceta de la investigación con- 
sistió en evaluar la efectividad de un índice numérico de la diversidad de especies para 
indicar la degradación del agua debida al desagiie ácido de una mina. Conceptualmente, 
un índice elevado de la diversidad de especies macroinvertebradas debería indicar un 
sistema acuático no contaminado; mientras que un índice bajo de esta diversidad indica- 
ría un sistema acuático contaminado. 

Se eligieron 2 estaciones de muestreo independientes para este estudio: una que se 
localiza corriente abajo del punto de descarga ácida de la mina y la otra ubicada corriente 
arriba. Para 12 muestras mensuales reunidas en la estación corriente abajo el índice de di- 
versidad de especies tuvo un valor medio de x, = 3.11 y una desviación estándar de 
s, = 0.771; mientras que 10 muestras reunidas mensualmente en la estación corriente arri- 
ba tuvieron un valor medio del índice х, = 2.04 y una desviación estándar de s, = 0.448. 
Calculemos un intervalo de confianza del 90% para la diferencia entre las medias de la 
población de los dos sitios, suponiendo que las poblaciones se distribuyen de forma 
aproximadamente normal y que tienen varianzas iguales. 

Representemos con рш, y pu, las medias de la población para los índices de diversidad de es- 
pecies en las estaciones corriente abajo y corriente arriba, respectivamente. Deseamos en- 
contrar un intervalo de confianza del 90% para pu, — pu, La estimación puntual de yu, — р, es 


ху —X2 =3.11-2.04 = 1.07 
El estimado agrupado, P de la varianza común, ©?, es 


(Mm Dsi + (по — 1)55 _ (100.771?) +( 90.448?) 


= = = 0.417. 
р пана =2 PESE) 9 


Al sacar la raíz cuadrada obtenemos 5 = = 0.646. Si usamos & = 0.1, encontramos en la 
tabla A.4 que „= 1.725 para v = л, ү п„— 2 = 20 grados de libertad. Por lo tanto, el 


0.05 
intervalo de confianza del 90% para Ше р, еѕ 


[1 1 1 1 
1.07 — (1.72 .64 == == = 1.07 + (1.72 .64 ==» 
07 =( 510.646) mu pa < 1.07 + ( 5)(0.646) 010 


que se simplifica а 0.593 < pu, – H, < 1.547. Д 
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Interpretación del intervalo de confianza 


Para el caso de un solo parámetro el intervalo de confianza simplemente produce límites 
de error del parámetro. Los valores contenidos en el intervalo se deberían ver como va- 
lores razonables, dados los datos experimentales. En el caso de una diferencia entre dos 
medias, la interpretación se puede extender a una comparación de las dos medias. Por 
ejemplo, si tenemos gran confianza en que una diferencia џи, — 4, es positiva, sin duda 
inferiremos que 4, > p, con poco riesgo de incurrir en un error. Así, en el ejemplo 9.11 
tenemos un 90% de confianza en que el intervalo de 0.593 a 1.547 contiene la diferencia 
de las medias de la población para valores del índice de diversidad de especies en las dos 
estaciones. El hecho de que ambos límites de confianza sean positivos indica que, en 
promedio, el índice para la estación que se localiza corriente abajo del punto de descarga 
es mayor que el índice para la estación que se localiza corriente arriba. 


Muestras de tamaños iguales 


El procedimiento para construir intervalos de confianza para 1, – p, cuando O, = С, = с 
pero ésta se desconoce, requiere suponer que las poblaciones son normales. Desviacio- 
nes ligeras de la suposición de varianzas iguales o de normalidad no alteran seriamente 
el grado de confianza en nuestro intervalo. (En el capítulo 10 se estudia un procedimiento 
para probar la igualdad de dos varianzas poblacionales desconocidas con base en la in- 
formación que proporcionan las varianzas muestrales). Si las varianzas de la población 
son considerablemente diferentes, aún obtenemos resultados razonables cuando las 
poblaciones son normales, siempre y cuando n, = n,. Por lo tanto, al planear un experi- 
mento se debería hacer un esfuerzo por igualar el tamaño de las muestras. 


Varianzas desconocidas y distintas 


Consideremos ahora el problema de calcular el estimado de un intervalo de 1, — 4, cuando 
no es probable que las varianzas de la población desconocidas sean iguales. El estadístico 
que se utiliza con mayor frecuencia en este caso es 


т' = (X1 — X2) — (ш — o) 
VS? /m)+(82/n2) ` 


que tiene aproximadamente una distribución f con v grados de libertad, donde 


= (52 /пу +53/n2Y | 
[052 /п\)? /(п = DI + (5/12 /(п› — 1)] 


Como v rara vez es un entero, lo redondeamos al número entero menor más cercano. El 
estimado anterior de los grados de libertad se denomina aproximación de Satterthwaite 
(Satterthwaite, 1946, en la bibliografía). 

Con el estadístico T”, escribimos 


P(—taj2 < T' < taj2) = 1-0, 


donde г, pes el valor de la distribución Т con v grados de libertad por arriba del cual en- 
contramos una área de 2/2. Al sustituir para 7' en la desigualdad y seguir los mismos 
pasos que antes, establecemos el resultado final. 
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Intervalo de 
confianza para 
H7 H» 

с? + оҳ y ambas 
varianzas se 
desconocen 


Six y s? y X, y s2 son las medias y varianzas de muestras aleatorias independientes de 
tamaños n, y n,, respectivamente, tomadas de poblaciones aproximadamente normales 
con varianzas desconocidas y diferentes, un intervalo de confianza aproximado del 100(1 
— 0)% para и — H, es dado por 


2 
21 


2 
n _ $ $ Z 
Gi —X2) — ta/2 + = < Шш — ш < (ž1 —X2) + taj2 
1 2 


donde b pes el valor £ con 


(51/л1 +53/n2) 
5/02/01 = 1)] + Ks}/m} /(12 — D] 


grados de libertad, que deja una área de 0/2 a la derecha. 


Observe que la expresión para el valor v anterior incluye variables aleatorias y, por 
consiguiente, v es un estimado de los grados de libertad. En las aplicaciones este estimado 
no será un número entero, de manera que el analista lo debe redondear al entero menor 
más cercano para lograr la confianza que se busca. 

Antes de ilustrar el intervalo de confianza anterior con un ejemplo deberíamos seña- 
lar que todos los intervalos de confianza para 1, — 4, tienen la misma forma general, 
como los de una sola media; a saber, se pueden escribir como 


estimación puntual + t, р é.e.(estimación puntual) 


estimación puntual + 2, e.e.(estimación puntual). 


а/2 


Por ejemplo, en el caso donde o, = о, = о, el error estándar estimado de 


Х| —X2 esspy/1/n1 + 1/n2. Para el caso donde o? +03, 


Ejemplo 9.12: |El Departamento de zoología de Virginia Tech llevó a cabo un estudio para estimar la 


Solución: 


diferencia en la cantidad de ortofósforo químico medido en dos estaciones diferentes 
del río James. El ortofósforo se mide en miligramos por litro. Se reunieron 15 mues- 
tras de la estación 1 y 12 muestras de la estación 2. Las 15 muestras de la estación 1 
tuvieron un contenido promedio de ortofósforo de 3.84 miligramos por litro y una 
desviación estándar de 3.07 miligramos por litro; en tanto que las 12 muestras de la 
estación 2 tuvieron un contenido promedio de 1.49 miligramos por litro y una desvia- 
ción estándar de 0.80 miligramos por litro. Calcule un intervalo de confianza de 95% 
para la diferencia en el contenido promedio verdadero de ortofósforo en estas dos 
estaciones. Suponga que las observaciones provienen de poblaciones normales con 
varianzas diferentes. 

Para la estación 1 tenemos x= 3.84, s = 3.07 y n= 15. Para la estación 2, x= 1.49, 
s, = 0.80 y n, = 12. Queremos obtener un intervalo de confianza del 95% para p, – р. 
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Como se suponen varianzas de la población diferentes, sólo podemos calcular un inter- 
valo de confianza aproximado del 95% basado en la distribución £ con v grados de liber- 
tad, donde 


(3.072 /15 + 0.802 /12)? 


v= [63.072 /15)2/14] + [(0.802/12)2/11] = 16.3 = 16. 


Nuestra estimación puntual de 1, — р, es 
Ху —X2 = 3.84 — 1.49 = 2.35. 


Si usamos а = 0.05, en la tabla A.4 encontramos que 1, ,,¿ = 2.120 para v = 16 grados 
de libertad. Por lo tanto, el intervalo de confianza del 95% para p, — 4, es 


3.072 0.802 3.072 0.802 
- 2. 2.12 
15 + 12 < ш = Ш < 2.35 + 0 15 + Т? 


2.35 — 2.120 


que se simplifica a 0.60 < ш — u, < 4.10. En consecuencia, tenemos un 95% de confian- 
za en que el intervalo de 0.60 a 4.10 miligramos por litro contiene la diferencia del pro- 
medio verdadero del ortofósforo que contienen estos dos lugares. 

Cuando se desconocen dos varianzas de la población, la suposición de varianzas 
iguales o diferentes podría ser precaria. En la sección 10.10 se presentará un procedi- 
miento que ayudará a distinguir entre las situaciones con la misma varianza y con varian- 
za diferente. 


9.9 Observaciones pareadas 


Ahora estudiaremos los procedimientos de estimación para la diferencia de dos medias 
cuando las muestras no son independientes y las varianzas de las dos poblaciones no son 
necesariamente iguales. La situación que se considera aquí tiene que ver con una condi- 
ción experimental muy especial, a saber, las observaciones pareadas. A diferencia de la 
situación que se describió antes, las condiciones de las dos poblaciones no se asignan de 
forma aleatoria a las unidades experimentales. Más bien, cada unidad experimental 
homogénea recibe ambas condiciones de la población; como resultado, cada unidad ex- 
perimental tiene un par de observaciones, una para cada población. Por ejemplo, si rea- 
lizamos una prueba de una nueva dieta con 15 individuos, los pesos antes y después de 
seguir la dieta conforman la información de las dos muestras. Las dos poblaciones son 
“antes” y “después”, y la unidad experimental es el individuo. Evidentemente, las obser- 
vaciones en un par tienen algo en común. Para determinar si la dieta es efectiva conside- 
ramos las diferencias а, de... d, en las observaciones pareadas. Estas diferencias son los 
valores de una muestra aleatoria Р, D,,..., D, de una población de diferencias, que su- 
pondremos distribuidas normalmente, con media р, = H, — (1, y varianza ор. Estimamos 
ср mediante 52, la varianza de las diferencias que constituyen nuestra muestra. El esti- 
mador puntual de и es dado por D. 


¿Cuándo debe hacerse el pareado? 


Parear observaciones en un experimento es una estrategia que se puede emplear en muchos 
campos de aplicación. Se expondrá al lector a tal concepto en el material relacionado con 
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la prueba de hipótesis en el capítulo 10 y en los temas de diseño experimental en los 
capítulos 13 y 15. Al seleccionar unidades experimentales relativamente homogéneas 
(dentro de las unidades) y permitir que cada unidad experimente ambas condiciones de 
la población, se reduce la varianza del error experimental efectiva (en este caso оў). El 
lector puede visualizar la ¡-ésima diferencia del par como 


Di = Хі —Xaj. 


Como las dos observaciones se toman de la unidad experimental de la muestra no son 
independientes y, de hecho, 


Var(D¡) = Var(X 1; —X 2) = 0% +02 — 2 Cov(X ү, X 9). 


Entonces, de manera intuitiva, se espera que оў debería reducirse debido а la similitud 
en la naturaleza de los “errores” de las dos observaciones dentro de una unidad experi- 
mental, a lo cual se llega mediante la expresión anterior. En realidad se espera que, si la 
unidad es homogénea, la covarianza sea positiva. Como resultado, la ganancia en calidad 
del intervalo de confianza sobre la que se obtuvo sin parear es mayor cuando hay homo- 
geneidad dentro de las unidades y cuando las diferencias grandes van de una a otra uni- 
dad. Se debería tener en cuenta que el desempeño del intervalo de confianza dependerá 
del error estándar de D, que es, por supuesto, Op / Jn, donde п es el número de pares. 
Como indicamos antes, la intención al parear es reducir с. 


Equilibrio entre reducir la varianza y perder grados de libertad 


Al comparar los intervalos de confianza obtenidos con y sin pareado es evidente que hay 
un intercambio implicado. Aunque en realidad el pareado debería reducir la varianza 
y, por lo tanto, el error estándar de la estimación puntual, los grados de libertad disminuyen 
al reducir el problema a uno con una sola muestra. Como resultado, el punto t, р ligado al 
error estándar se ajusta en concordancia. De esta manera, el pareado podría resultar con- 
traproducente. Esto ocurriría con certeza si se experimenta sólo una reducción modesta 
en la varianza (a través de da) mediante el pareado. 

Otra ilustración del pareado implicaría elegir n pares de sujetos, donde cada par 
tenga una característica similar, como el coeficiente intelectual (CD), la edad o la raza, y 
luego para cada par seleccionar un miembro al azar para obtener un valor de Х\, dejando 
que el otro miembro proporcione el valor de X,. En este caso, X, y X, podrían representar 
las calificaciones obtenidas por dos individuos con igual CI cuando uno es asignado al 
azar a un grupo que usa el método de enseñanza convencional y al otro a un grupo que 
utiliza materiales programados. 

Se puede establecer un intervalo de confianza del 100(1 — 0)% para y, escribiendo 


P(Haj2 <T < tap) = 1-0, 


donde T= 0 = y £ ,, сото antes, es un valor de la distribución £ con n — 1 grados de 
É afn? “0/2 
libertad. 

En la actualidad se acostumbra reemplazar T por su definición en la desigualdad 
anterior y desarrollar los pasos matemáticos que conduzcan al siguiente intervalo de 
confianza del 100(1 — @)% para и – H, = Hp 
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Intervalo de Sid y s, Son la media y la desviación estándar, respectivamente, de las diferencias distri- 
confianza para buidas normalmente de n pares aleatorios de mediciones, un intervalo de confianza del 
Up = Ш = Ш para 100(1 — 0)% para H, = H — H, es 
observaciones 


pareadas d—taj2—= < Mo < d+ taj2 == 


ү үт 


donde г, pes el valor £ con v = n — 1 grados de libertad, que deja una área de 2/2 a la 


derecha. 


Ejemplo 9.13: | Un estudio publicado en Chemosphere reporta los niveles de la dioxina TCDD en 20 ve- 
teranos de Vietnam de Massachusetts, quienes posiblemente estuvieron expuestos al agen- 
te naranja. En la tabla 9.1 se presentan los niveles de TCDD en plasma y tejido adiposo. 

Calcule un intervalo de confianza del 95% рага y, — џр,, donde u, y H, representen 
las medias verdaderas de los niveles de TCDD en plasma y en tejido adiposo, respecti- 
vamente. Suponga que la distribución de las diferencias es casi normal. 


Tabla 9.1: Datos para el ejemplo 9.13. 


Niveles Niveles Niveles Niveles 
de TCDD de TCDD en de TCDD de TCDD en 
Veterano en plasma tejido adiposo di Veterano en plasma tejido adiposo di 
1 2.5 4.9 —2.4 11 6.9 7.0 —0.1 
2 3.1 5.9 —2.8 12 3.3 2.9 0.4 
3 2.1 4.4 —2.3 13 4.6 4.6 0.0 
4 3.5 6.9 —3.4 14 1.6 1.4 0.2 
5 3.1 7.0 —3.9 15 7.2 77 —0.5 
6 1.8 4.2 —2.4 16 1.8 1.1 0.7 
7 6.0 10.0 4.0 17 20.0 11.0 9.0 
8 3.0 5.5 —2.5 18 2.0 2.5 —0.5 
9 36.0 41.0 =5.0 19 2.5 2.3 0.2 
10 4.7 4.4 0.3 20 4.1 2.5 1.6 


Reproducido de Chemosphere, Vol. 20, Núms. 7-9 (tablas I y П), Schecter et al., “Partitioning 2, 3, 7, 8-chlorinated 
dibenzo-p-dioxins and dibenzofurans between adipose tissue and plasma lipid of 20 Massachusetts Vietnam veterans”, 
pp. 954-955, Derechos reservados ©1990, con autorización de Elsevier. 


Solución: Buscamos un intervalo de confianza del 95% para џ, — и. Como las observaciones es- 
tán pareadas, и — H, = Hp. La estimación puntual de 4, es d = —0.87. La desviación 
estándar s, de las diferencias muestrales es 


168. 20 
5а = Ya —4 == 2.9773. 
Si usamos а = 0.05, en la tabla A.4 encontramos que t 


0.025 — 2.093 para у = п – 1= 19 
grados de libertad. Por lo tanto, el intervalo de confianza del 95% es 


2.977 2.977 
—0.8700 — (2.093) (ЖЭ) < Up < —0.8700 + (2.093) (257), 
№20 №20 
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o simplemente -2.2634 < „< 0.5234, de lo cual concluimos que no hay diferencia sig- 
nificativa entre el nivel medio de TCDD en plasma y el nivel medio de TCDD en tejido 
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adiposo. 
Ejercicios 
9.35 Una muestra aleatoria de tamaño n, = 25, toma- 


da de una población normal con una desviación es- 
tándar с, = 5, tiene una media х, = 80. Una segunda 
muestra aleatoria de tamaño п, = 36, que se toma de 
una población normal diferente con una desviación es- 
tándar о, = 3, tiene una media х, = 75. Calcule un in- 
tervalo de confianza del 94% para и, — ш. 


9.36 Se comparan las resistencias de dos clases de 
hilo. Se prueban 50 piezas de cada clase de hilo en con- 
diciones similares. La marca A tiene una resistencia a la 
tensión promedio de 78.3 kilogramos, con una desviación 
estándar de 5.6 kilogramos; en tanto que la marca B 
tiene una resistencia a la tensión promedio de 87.2 ki- 
logramos con una desviación estándar de 6.3 kilogra- 
mos. Construya un intervalo de confianza del 95% para 
la diferencia de las medias de la población. 


9.37 Se realiza un estudio para determinar si cierto 
tratamiento tiene algún efecto sobre la cantidad de me- 
tal que se elimina en una operación de encurtido. Una 
muestra aleatoria de 100 piezas se sumerge en un baño 
por 24 horas sin el tratamiento, lo que produce un pro- 
medio de 12.2 milímetros de metal eliminados y una 
desviación estándar muestral de 1.1 milímetros. Una 
segunda muestra de 200 piezas se somete al tratamien- 
to, seguido de 24 horas de inmersión en el baño, lo que 
da como resultado una eliminación promedio de 9.1 
milímetros de metal, con una desviación estándar 
muestral de 0.9 milímetros. Calcule un estimado 
del intervalo de confianza del 98% para la diferencia 
entre las medias de las poblaciones. ¿El tratamiento pa- 
rece reducir la cantidad media del metal eliminado? 


9.38 En un proceso químico por lotes se comparan los 
efectos de dos catalizadores sobre la potencia de la reac- 
ción del proceso. Se prepara una muestra de 12 lotes uti- 
lizando el catalizador 1 y una muestra de 10 lotes utilizando 
el catalizador 2. Los 12 lotes para los que se utilizó el 
catalizador 1 en la reacción dieron un rendimiento pro- 
medio de 85 con una desviación estándar muestral de 4; 
en tanto que para la segunda muestra, la de 10 lotes, el 
promedio fue de 81, con una desviación estándar mues- 
tral de 5. Calcule un intervalo de confianza del 90% para 
la diferencia entre las medias de la población, suponiendo 
que las poblaciones se distribuyen de forma aproximada- 
mente normal y que tienen varianzas iguales. 

9.39 Los estudiantes pueden elegir entre un curso de 
física de tres semestres-hora sin laboratorio y un curso 
de cuatro semestres-hora con laboratorio. El examen 


final escrito es el mismo para ambos cursos. Si 12 estu- 
diantes del curso con laboratorio obtienen una ca- 
lificación promedio de 84, con una desviación estándar 
de 4, y 18 estudiantes del grupo sin laboratorio obtienen 
una calificación promedio de 77, con una desviación 
estándar de 6, calcule un intervalo de confianza del 
99% para la diferencia entre las calificaciones prome- 
dio para ambos cursos. Suponga que las poblaciones se 
distribuyen de forma aproximadamente normal y que 
tienen varianzas iguales. 


9.40 En un estudio que se lleva a cabo en Virginia 
Tech sobre el desarrollo de micorriza, una relación sim- 
biótica entre las raíces de árboles y un hongo, en la cual 
se transfieren minerales del hongo a los árboles y azú- 
cares de los árboles a los hongos, se cultivaron en un 
invernadero 20 robles rojos que fueron expuestos al 
hongo Pisolithus tinctorus. Todos los árboles se planta- 
ron en el mismo tipo de suelo y recibieron la misma 
cantidad de luz solar y agua. La mitad no recibió nitró- 
geno en el momento de plantarlos y sirvió como con- 
trol, y la otra mitad recibió 368 ppm de nitrógeno en 
forma de NaNO,. Después de 140 días se registraron 
los siguientes pesos de los tallos, en gramos: 

Sin nitrógeno Con nitrógeno 


0.32 0.26 
0.53 0.43 
0.28 0.47 
0.37 0.49 
0.47 0.52 
0.43 0.75 
0.36 0.79 
0.42 0.86 
0.38 0.62 
0.43 0.46 


Construya un intervalo de confianza del 95% рага la 
diferencia entre los pesos medios de los tallos que no 
recibieron nitrógeno y los que recibieron 368 ppm de 
nitrógeno. Suponga que las poblaciones están distribui- 
das normalmente y que tienen varianzas iguales. 

9.41 Los siguientes datos representan el tiempo, en 
días, que pacientes tratados al azar con uno de dos me- 
dicamentos para curar infecciones graves de la vejiga 
tardaron en recuperarse: 


Medicamento 1 Medicamento 2 


ni = 14 n: = 16 
17 х2 = 19 
51 = 1.5 55 = 1.8 


Ejercicios 


Calcule un intervalo de confianza del 99% para la dife- 
rencia 1, – ш, en los tiempos medios de recuperación 
para los dos medicamentos. Suponga poblaciones nor- 
males que tienen varianzas iguales. 


9.42 Un experimento publicado en Popular Science 
comparó el ahorro de combustible para dos tipos de ca- 
miones compactos que funcionan con diesel y están 
equipados de forma similar. Suponga que se utilizaron 
12 camiones Volkswagen y 10 Toyota en pruebas con una 
velocidad constante de 90 kilómetros por hora. Si los 
12 camiones Volkswagen promedian 16 kilómetros por 
litro con una desviación estándar de 1.0 kilómetros 
por litro, y los 10 Toyota promedian 11 kilómetros por 
litro con una desviación estándar de 0.8 kilómetros 
por litro, construya un intervalo de confianza del 90% 
para la diferencia entre los kilómetros promedio por 
litro de estos dos camiones compactos. Suponga que 
las distancias por litro para cada modelo de camión es- 
tán distribuidas de forma aproximadamente normal y 
que tienen varianzas iguales. 
9.43 Una empresa de taxis trata de decidir si compra- 
rá neumáticos de la marca A o de la marca B para su 
flotilla de taxis. Para estimar la diferencia entre las dos 
marcas realiza un experimento utilizando 12 neumáti- 
cos de cada marca, los cuales utiliza hasta que se des- 
gastan. Los resultados son: 

Marca A: x, = 36,300 kilómetros, 
5000 kilómetros. 
38,100 kilómetros, 
, = 6100 kilómetros. 


Calcule un intervalo de confianza del 95% para ш, — Hy 
suponiendo que las poblaciones se distribuyen de for- 
ma aproximadamente normal. Puede no suponer que 
las varianzas son iguales. 

9.44 Соп referencia al ejercicio 9.43, calcule un in- 
tervalo de confianza del 99% para и, — pu, si se asignan 
al azar neumáticos de las dos marcas a las ruedas trase- 
ras izquierda y derecha de 8 taxis y se registran las si- 
guientes distancias, en kilómetros: 


ы‘ 


5 
Marca В: х 
Ку 


Taxi Marca А Marca В 
1 34,400 36,700 
2 45,500 46,800 
3 36,700 37,700 
4 32,000 31,100 
5 48,400 47,800 
б 32,800 36,400 
7 38,100 38,900 
8 30,100 31,500 


Suponga que las diferencias de las distancias se distri- 
buyen de forma aproximadamente normal. 


9.45 El gobierno otorgó fondos para los departamen- 
tos de agricultura de 9 universidades para probar las 
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capacidades de cosecha de dos nuevas variedades de 
trigo. Cada variedad se siembra en parcelas con la mis- 
ma área en cada universidad, y las cosechas, en kilogra- 
mos por parcela, se registran como sigue: 


Universidad 
Variedad 1 2 3 4 5 6 7 8 9 


1 38 23 35 41 44 29 37 31 38 
2 45 25 31 38 50 33 36 40 43 


Calcule un intervalo de confianza del 95% para la dife- 
rencia media entre las cosechas de las dos variedades, 
suponiendo que las diferencias entre las cosechas se 
distribuyen de forma aproximadamente normal. Expli- 
que por qué es necesario el pareado en este problema. 


9.46 Los siguientes datos representan el tiempo de 
duración de películas producidas por dos empresas ci- 
nematográficas. 


Empresa | Tiempo (minutos) 
I 103 94 110 87 98 
П 97 82 123 92 175 88 118 


Calcule un intervalo de confianza del 90% para Іа dife- 
rencia entre la duración promedio de las películas que 
producen las dos empresas. Suponga que las diferen- 
cias en la duración se distribuyen de forma aproxima- 
damente normal y que tienen varianzas distintas. 


9.47 La revista Fortune (marzo de 1997) publicó la 
rentabilidad total de los inversionistas durante los 10 
años anteriores a 1996 y también la de 431 empresas en 
ese mismo año. A continuación se lista la rentabilidad 
total para 10 de las empresas. Calcule un intervalo de 
confianza del 95% para el cambio promedio en el por- 
centaje de rentabilidad de los inversionistas. 


Rentabilidad total 
para los inversionistas 

Empresa 1986-96 1996 
Coca-Cola 29.8% 43.3% 
Mirage Resorts 27.9% 25.4% 
Merck 22.1% 24.0% 
Microsoft 44.5% 88.3% 
Johnson & Johnson 22.2% 18.1% 
Intel 43.8% 131.2% 
Pfizer 21.7% 34.0% 
Procter & Gamble 21.9% 32.1% 
Berkshire Hathaway 28.3% 6.2% 
S&P 500 11.8% 20.3% 


9.48 Una empresa automotriz está considerando dos 
tipos de baterías para sus vehículos. Con ese fin reúne 
información muestral sobre la vida de las baterías. 
Utiliza para ello 20 baterías del tipo A y 20 baterías 
del tipo В. El resumen de los estadísticos es х, = 32.91, 
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х, = 30.47, s, = 1.57 y s, = 1.74. Suponga que los 
datos de cada batería se distribuyen normalmente y que 


O, = Oy: 
a) Calcule un intervalo de confianza del 95% para 
Ш, = Hp 


b) Del inciso a) saque algunas conclusiones que le 
ayuden a la empresa a decidir si debería utilizar la 
batería A o la B. 


9.49 Se considera usar dos marcas diferentes de pin- 
tura vinílica. Se seleccionaron 15 especímenes de cada 
tipo de pintura, para los cuales los tiempos de secado 
en horas fueron los siguientes: 


Pintura A | 


3.5 2739 423.6 
27 3.3 5.2 4.2 2.9 
44 5.2 4.0 4.1 3.4 


Pintura В 
47 3.9 4.5 5.5 4.0 
5.3 43 6.0 5.2 3.7 
5.5 6.2 5.1 5.4 4.8 
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Suponga que el tiempo de secado se distribuye normal- 
mente, con т, = 0,. Calcule un intervalo de confianza 
del 95% de р, — H, donde u, y H son los tiempos me- 
dios de secado. 


9.50 А dos grupos de ratas diabéticas se les suminis- 
tran dos niveles de dosis de insulina (alto y bajo) para 
verificar la capacidad de fijación de esta hormona. Se 
obtuvieron los siguientes datos. 


8 ху = 1.98 
13 х2 = 1.30 


51 = 0.51 
52 = 0.35 


Dosis baja: nı 
Dosis alta: n2 


Suponga que las varianzas son iguales. Determine un 
intervalo de confianza del 95% para la diferencia en la 
capacidad promedio verdadera de fijación de la insuli- 
na entre las dos muestras. 


9.10 Una sola muestra: estimación de una proporción 


El estadístico P = X /n, en donde X representa el número de éxitos en n ensayos, provee 
un estimador puntual de la proporción p en un experimento binomial. Por lo tanto, la 
proporción de la muestra р = x/n se utilizará como el estimador puntual del parámetro р. 

Si no se espera que la proporción p desconocida esté demasiado cerca de 0 o de 1, 
se puede establecer un intervalo de confianza para p considerando la distribución mues- 
tral de P. Si en cada ensayo binomial asignamos el valor O a un fracaso y el valor 1 a un 
éxito, el número de éxitos, x, se puede interpretar como la suma de n valores que consta 
sólo de ceros y unos, y p es sólo la media muestral de esos n valores. En consecuencia, 
por el teorema del límite central, para n suficientemente grande P está distribuida de 


forma casi normal con media 


д Х пр 
п п 
y varianza 
о?. = о? ох _ пра _ Pg 
P X/n n2 P Е 


Por lo tanto, podemos afirmar que 


P(=za/2 < Z <Za/2)= 1 — Q, con Z = 


Ê -p 


КЛА 


У Zap ES el valor por arriba del cual encontramos una área de œ/2 debajo de la curva 
normal estándar. Al sustituir para Z escribimos 


P —Za/2 < р. < Za | = 1-a. 
vpq/n 


Cuando n es grande se introduce un error muy pequeño sustituyendo el estimado puntual 
p = x/n para la p debajo del signo de radical. Entonces podemos escribir 


P. б = 2224 <р<Р +22) =1—Q. 
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Por otro lado, al resolver para p en la desigualdad cuadrática anterior, 


a 


ок A 
ypa/n 


obtenemos otra forma del intervalo de confianza para p con los siguientes límites: 


АК: 2. 2 
P+ n Хор 0а tap 
1+ в n 4n? 
n 


Para una muestra aleatoria de tamaño n se calcula la proporción muestral р = х/п y se 
pueden obtener los siguientes intervalos de confianza aproximados del 100(1 – 0)% para р. 


Intervalos de 
confianza para 

p de una muestra 
grande 


Si р es la proporción de éxitos en una muestra aleatoria de tamaño n, y G = 1 — р, un 
intervalo de confianza aproximado del 100(1 — а)% para el parámetro binomial p se 
obtiene por medio de (método 1) 


К [Ра А [Ра 
P — Za/2 ЕЗ <P < P+Za/2 Рт 


o mediante (método 2) 


5 y ©а/2 КО 2 any fan А 2 
р + К Za/2 р 0/2 P + + Za/2 P Za/2 
a = 27 + 4 2 < < 72 + 77 4 7> 
14-22. O 4 ч. ЖЫ 107 п 
donde z, pes el valor z que deja una área de 2/2 a la derecha. 


Cuando n es pequeña y se cree que la proporción desconocida р se acerca a доа 1, 
el procedimiento del intervalo de confianza que se establece aquí no es confiable y, por 
lo tanto, no se debería emplear. Para estar seguros se requiere que tanto пр como пў sean 
mayores que o iguales a 5. Los métodos para calcular un intervalo de confianza para el 
parámetro binomial p también se pueden aplicar cuando se está utilizando la distribución 
binomial con el fin de aproximar la distribución hipergeométrica; es decir, cuando n es 
pequeña respecto а N, como se ilustra en el ejemplo 9.14. 

Observe que, aunque el método 2 produce resultados más precisos, su cálculo es 
más complicado, y la ventaja en precisión que brinda disminuye cuando el tamaño de la 
muestra es lo suficientemente grande. Debido a esto en la práctica es más común utilizar 
el método 1. 


Ejemplo 9.14: | En una muestra aleatoria de n = 500 familias que tienen televisores en la ciudad de Ha- 


Solución: 


milton, Canadá, se encuentra que x = 340 están suscritas a HBO. Calcule un intervalo 
de confianza del 95% para la proporción real de familias que tienen televisores en esta 
ciudad y están suscritas a HBO. 


La estimación puntual de p es p = 340/500 = 0.68. Si usamos la tabla A.3, encontramos 
que 25 = 1.96. Por lo tanto, si utilizamos el método 1, el intervalo de confianza del 
95% para p es 


/(0.68)(0.32) /(0.68)(0.32) 
0.68 — 1.96 —— <р < 0.68 + 1.96 00° 


que se simplifica а 0.6391 <р < 0.7209. 
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Si utilizamos el segundo método, obtenemos 


= 0.6786 + 0.0408, 


1+ 1,9%? = 1+ 1.962 500 (4)(5002) 


0.68 + бушу | 1.96 үз 1.962 


500 


que se simplifica a 0.6378 < p < 0.7194. Aparentemente, cuando n es grande (500 en 
este caso) ambos métodos producen resultados muy similares. 

Si р es el valor central de un intervalo de confianza del 100(1 – 0)%, entonces 
р estima р sin error. Sin embargo, la mayoría de las veces р no será exactamente igual a p 
y el estimado puntual será erróneo. El tamaño de este error será la diferencia positiva que 
separa ар de р, y podemos tener una confianza del 100(1 – а)% de que tal diferencia no 
excederá a 22/2 y/Pq/n. Si dibujamos un diagrama de un intervalo de confianza típico, 
como el de la figura 9.6, podemos ver esto fácilmente. En este caso utilizamos el méto- 
do 1 para estimar el error. 


A 
р =: aP д/п р р р +20 д/п 


Figura 9.6: Error en la estimación de р por medio de р. 


Teorema 9.3: Si p se utiliza como un estimado de p, podemos tener un 100(1 – @)% de confianza en 


que el error no excederá а 24/2 y/Pq/n. 


En el ejemplo 9.14 tenemos un 95% de confianza en que la proporción de la muestra 
Р = 0.68 difiere de la verdadera proporción р en una cantidad que no excede a 0.04. 


Selección del tamaño de la muestra 


Determinemos ahora qué tan grande debe ser una muestra para poder estar seguros de 
que el error al estimar p será menor que una cantidad específica e. Por medio del teore- 
ma 9.3, debemos elegir una n tal que 22/2 /Pq/n = e. 


Teorema 9.4: Si р se utiliza como un estimado de p, podemos tener un 100(1 – @)% de confianza en 


que el error será menor que una cantidad específica e cuando el tamaño de la muestra 
sea aproximadamente 
J AA 
_ Zaj2P4 
= == 


e 


El teorema 9.4 es algo engañoso, pues debemos utilizar р para determinar el tamaño 
п de la muestra, pero р se calcula a partir de la muestra. Si se puede hacer una estimación 
burda de p sin tomar una muestra, se podría usar este valor para determinar n. A falta de 
tal estimado, podríamos tomar una muestra preliminar de tamaño n > 30 para proporcio- 
nar un estimado de p. Si utilizamos el teorema 9.4 podríamos determinar aproximada- 
mente cuántas observaciones se necesitan para proporcionar el grado de precisión 
deseado. Observe que los valores fraccionarios de n se redondean al siguiente número 
entero mayor. 
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Ejemplo 9.15: | ¿Qué tan grande debe ser una muestra en el ejemplo 9.14 si queremos tener un 95% de 
confianza en que la estimación de p esté dentro de 0.02 del valor verdadero? 


Solución: Tratemos a las 500 familias como una muestra preliminar que proporciona una estima- 
ción p = 0.68. Entonces, mediante el teorema 9.4, 


_ (1.96)2(0.68)(0.32) 


DoF = 2089.8 ~ 2090. 


Por lo tanto, si basamos nuestra estimación de p en una muestra aleatoria de tamaño 
2090, podemos tener un 95% de confianza en que nuestra proporción muestral no dife- 
rirá de la proporción verdadera en más de 0.02. J 

Ocasionalmente será poco práctico obtener una estimación de p que se utilice para 
determinar el tamaño muestral para un grado específico de confianza. Si esto sucede, se 
establece un límite superior para п al notar que pq = р(1 — р), que debe ser a lo sumo 
1/4, ya que р debe caer entre O y 1. Este hecho se verifica completando el cuadrado. Por 
consiguiente, 


2 
1 1 1 1 
1 — p) = —(p?=p= 2- 2—9 — = — — Й ==: 
$O - f) = = 0 == (> p+3) 1 ( 2). 
que siempre es menor que 1/4 excepto cuando р = 1/2 y entonces рӯ = 1/4. Por lo 
tanto, si sustituimos p = 1/2 en la fórmula para n del teorema 9.4, cuando, de hecho, 
р difiere de 1/2, entonces n se agrandará más de lo necesario para el grado de confianza 
específico y, como resultado, se incrementará nuestro grado de confianza. 


Teorema 9.5: Si utilizamos р como un estimado de p, podemos tener, al menos, un 100(1 – 2)% de 
confianza en que el error no excederá a una cantidad específica e cuando el tamaño 
de la muestra sea 


Ejemplo 9.16: | ¿Qué tan grande debe ser una muestra еп el ejemplo 9.14 si queremos tener al menos 
un 95% de confianza en que nuestra estimación de p está dentro de 0.02 del valor ver- 
dadero? 


Solución: A diferencia del ejemplo 9.15, supondremos ahora que no se tomó una muestra prelimi- 
nar para obtener una estimación de p. En consecuencia, podemos tener al menos un 95% 
de confianza en que nuestra proporción de la muestra no diferirá de la proporción verda- 
dera en más de 0.02, si elegimos una muestra de tamaño 


(1.96)? 


Si comparamos los resultados de los ejemplos 9.15 y 9.16, vemos que la informa- 
ción concerniente a p, proporcionada por una muestra preliminar, o quizás obtenida a 
partir de la experiencia, nos permite elegir una muestra más pequeña a la vez que man- 
tenemos el grado de precisión requerido. 
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9.11 Dos muestras: estimación de la diferencia 
entre dos proporciones 


Considere el problema en el que se busca estimar la diferencia entre dos parámetros bi- 
nomiales p, y p,. Por ejemplo, p, podría ser la proporción de fumadores con cáncer de 
pulmón y p, la proporción de no fumadores con cáncer de pulmón, y el problema consis- 
tiría en estimar la diferencia entre estas dos proporciones. Primero seleccionamos 
muestras aleatorias independientes de tamaños n, y n, a partir de las dos poblaciones 
binomiales con medias пр, y п„р„ у varianzas n pq, y n,p,q, respectivamente, después 
determinamos los números x, y x, de personas con cáncer de pulmón en cada muestra, y 
formamos las proporciones р, = x,/n y р, = x,/n. El estadístico Ê, — Ê, provee un esti- 
mador puntual de la diferencia entre las dos proporciones, p, — p,. Por lo tanto, la dife- 
rencia de las proporciones muestrales, р, — р„ se utilizará como la estimación puntual de 
PP 
Se puede establecer un intervalo de confianza para p, — р, considerando la distribu- 
ción muestral de P,— Р,. De la sección 9.10 sabemos que р, у Р, están distribuidos cada 
uno de forma aproximadamente normal, con medias p, y p,, y varianzas p q,/n, ур,9,/ 
1, respectivamente. Al elegir muestras independientes de las dos poblaciones nos asegu- 
ramos de que las variables Py Р, serán independientes y luego, por la propiedad repro- 
ductiva de la distribución normal que se estableció en el teorema 7.11, concluimos que 
P = Р, está distribuido de forma aproximadamente normal con media 


Mp, Pp, = Р Pa 
y varianza 


PM, Poe 


2 
© 3 . 
Р-Р» пі пә 


Por lo tanto, podemos asegurar que 
P(—zaj2 <Z < сар) = 1-0 
donde 


_ {Ру = Ё) (pp) 
Vpiqı/nı +p2q2/n2 


Y Zaj €S UN valor por arriba del cual encontramos una área de 0/2 debajo de la curva 
normal estándar. Al sustituir para Z escribimos 


(РВ, — P2) — (р — p2) 


vpiqu/n1 + p2q2/n2 


Después de realizar las operaciones matemáticas usuales reemplazamos р, Р», 
уа, bajo el signo de radical por sus estimaciones pa = хіп, р, =X,/M, 4, =1—P, y 
q, = 1 — р,, siempre y cuando n,p,,n,4,,n,p, y пд, sean todas mayores que o iguales a 
5, y se obtiene el siguiente intervalo de confianza aproximado del 100(1 — 0)% para p, –р,. 


P TZa/2 < <Za/2 =1-0 
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Intervalo de 
confianza para 
р, = р, de una 
muestra grande 


Si р, y р, son las proporciones de éxitos en muestras aleatorias de tamaños n, y n,, res- 
pectivamente, 4, = 1 — р, y ĝ, = 1 — р,, un intervalo de confianza aproximado del 
100(1 – @)% para la diferencia de dos parámetros binomiales p, — p, es dado por 


ACA AA A 


2% А я ĝi Рф 
ар <р — р < (фу ро) + Za/2 саа 
nı nz nı пэ 


(Рі —P2) — 202 


donde z,, ¡2 €8 el valor z que deja una área de œ/2 a la derecha. 


Ejemplo 9.17: | Se considera hacer un cierto cambio en el proceso de fabricación de partes componentes. 


Solución: 


Para determinar si el cambio en el proceso da como resultado una mejora, se toman 
muestras de partes fabricadas con el proceso nuevo y con el actual. Si se encuentra que 
75 de 1500 artículos manufacturados con el proceso actual están defectuosos y 80 
de 2000 manufacturados con el proceso nuevo también lo están, calcule un intervalo de 
confianza del 90% para la diferencia verdadera en la proporción de partes defectuosas 
entre el proceso actual y el nuevo. 


Suponga que p, y p, son las proporciones verdaderas de partes defectuosas para los pro- 
cesos actual y nuevo, respectivamente. En consecuencia, p, = 75/1500 = 0.05 y p, = 
80/2000 = 0.04, y la estimación puntual de p, — p, es 


фі = ро = 0 .05 — 0.04 = 0.01. 


Si utilizamos la tabla A.3, encontramos z,,. = 1.645. Por lo tanto, al sustituir en la 


fórmula 


0.05 


(0.05)(0.95) (0.04)(0.96) 
1.64 = 0.0117 
Е 1500 2000 SRE 


encontramos que el intervalo de confianza del 90% es -0.0017 < p, — p, < 0.0217. 

Como el intervalo contiene el valor 0, no hay razón para creer que el nuevo proceso, 

comparado con el actual, disminuye en forma significativa la proporción de artículos 

defectuosos. J 
Hasta aquí todos los intervalos de confianza presentados son de la forma 


estimación puntual + К e.e. (estimación puntual), 


donde К es una constante (ya sea г o el punto porcentual normal). Esta forma es válida 
cuando el parámetro es una media, una diferencia entre medias, una proporción o una 
diferencia entre proporciones, debido a la simetría de las distribuciones t y Z. Sin embar- 
go, no se extiende a las varianzas ni a los cocientes de las varianzas, las cuales se exami- 
narán en las secciones 9.12 y 9.13. 
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Ejercicios 
En este conjunto de ejercicios, para una estimación 
respecto a una proporción, utilice sólo el método 1 


para calcular los intervalos de confianza, a menos 
que se especifique otra cosa. 


9.51 En una muestra aleatoria de 1000 viviendas en 
cierta ciudad se encuentra que 228 utilizan petróleo 
como combustible para la calefacción. Calcule interva- 
los de confianza del 99% para la proporción de vivien- 
das en esta ciudad que utilizan petróleo con el fin 
mencionado. Utilice los dos métodos que se presenta- 
ron en la página 297. 


que se presentaron en la página 297. 


9.54 Un fabricante de reproductores de МРЗ utiliza 
un conjunto de pruebas exhaustivas para evaluar el fun- 
cionamiento eléctrico de su producto. Todos los repro- 
ductores de MP3 deben pasar todas las pruebas antes 
de ser puestos a la venta. De una muestra aleatoria de 
500 reproductores, 15 no pasan una o más de las prue- 
bas. Calcule un intervalo de confianza del 90% para la 
proporción de los reproductores de MP3 de la pobla- 
ción que pasan todas las pruebas. 


9.55 Se está considerando un nuevo sistema de lanza- 

miento de cohetes para el despliegue de cohetes peque- 

ños, de corto alcance. La probabilidad de que el sistema 

existente tenga un lanzamiento exitoso se representa con 

р = 0.8. Se toma una muestra de 40 lanzamientos expe- 

rimentales con el nuevo sistema y 34 resultan exitosos. 
a) Construya un intervalo de confianza del 95% para p. 
b) ¿Con base en sus resultados, concluiría que el nue- 

vo sistema es mejor? 


9.56 Un genetista está interesado en determinar la 
proporción de hombres africanos que padecen cierto 
trastorno sanguíneo menor. En una muestra aleatoria de 
100 hombres africanos encuentra que 24 lo padecen. 
a) Calcule un intervalo de confianza del 99% para la 
proporción de hombres africanos que padecen este 
trastorno sanguíneo. 
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b) ¿Qué podríamos afirmar con 99% de confianza 
acerca de la posible magnitud de nuestro error, si 
estimamos que la proporción de hombres africa- 
nos con dicho trastorno sanguíneo es 0.24? 


9.57 а) De acuerdo con un reporte del Roanoke Ti- 
mes & World-News, aproximadamente 2/3 de los 
1600 adultos encuestados vía telefónica dijeron 
que piensan que invertir en el programa del trans- 
bordador espacial es bueno para Estados Unidos. 
Calcule un intervalo de confianza del 95% para la 
proporción de adultos estadounidenses que pien- 
san que el programa del transbordador espacial 
es una buena inversión para su país. 

¿Qué podríamos afirmar con un 95% de confianza 
acerca de la posible magnitud de nuestro error, si 
estimamos que la proporción de adultos estadouni- 
denses que piensan que el programa del transbor- 
dador espacial es una buena inversión es de 2/3? 


= 
= 


9.58 En el artículo del periódico al que se hace refe- 
rencia en el ejercicio 9.57, 32% de los 1600 adultos 
encuestados dijo que el programa espacial estadouni- 
dense debería enfatizar la exploración científica. ¿Qué 
tamaño debería tener una muestra de adultos para la 
encuesta si se desea tener un 95% de confianza en que 
el porcentaje estimado esté dentro del 2% del porcenta- 
je verdadero? 


9.60 ¿Qué tamaño debería tener una muestra si de- 
seamos tener un 99% de confianza en que nuestra pro- 
porción de la muestra en el ejercicio 9.51 esté dentro 
del 0.05 de la proporción verdadera de viviendas en esa 
ciudad que utilizan petróleo como combustible para la 
calefacción? 


9.62 Una conjetura de un catedrático del departamen- 
to de microbiología, de la Facultad de Odontología de 
la Universidad de Washington, en St. Louis, Missouri, 
afirma que un par de tasas diarias de té verde o negro 
proporciona suficiente flúor para evitar el deterioro de 
los dientes. ¿Qué tan grande debería ser la muestra para 
estimar el porcentaje de habitantes de cierta ciudad que 
están a favor de tener agua fluorada, si se desea tener al 
menos un 99% de confianza en que el estimado está 
dentro del 1% del porcentaje verdadero? 


9.12 Una sola muestra: estimación de la varianza 


9.63 Se llevará a cabo un estudio para estimar el por- 
centaje de ciudadanos de una ciudad que están a favor de 
tener agua fluorada. ¿Qué tan grande debería ser la mues- 
tra si se desea tener al menos 95% de confianza en que el 
estimado esté dentro del 1% del porcentaje verdadero? 


9.64 Se realizará un estudio para estimar la propor- 
ción de residentes de cierta ciudad y sus suburbios que 
está a favor de que se construya una planta de energía 
nuclear cerca de la ciudad. ¿Qué tan grande debería ser 
la muestra, si se desea tener al menos un 95% de con- 
fianza en que el estimado esté dentro del 0.04 de la ver- 
dadera proporción de residentes que están a favor de 
que se construya la planta de energía nuclear? 


9.65 А cierto genetista le interesa determinar la pro- 
porción de hombres y mujeres de la población que pa- 
decen cierto trastorno sanguíneo menor. En una 
muestra aleatoria de 1000 hombres encuentra que 250 
lo padecen; mientras que de 1000 mujeres examinadas, 
275 parecen padecerlo. Calcule un intervalo de con- 
fianza del 95% para la diferencia entre la proporción de 
hombres y mujeres que padecen el trastorno sanguíneo. 


9.66 Se encuestan 10 escuelas de ingeniería de Esta- 
dos Unidos. La muestra contiene a 250 ingenieros eléc- 
tricos, de los cuales 80 son mujeres; y 175 ingenieros 
químicos, de los cuales 40 son mujeres. Calcule un in- 
tervalo de confianza del 90% para la diferencia entre la 
proporción de mujeres en estos dos campos de la inge- 
niería. ¿Hay una diferencia significativa entre las dos 
proporciones? 


9.67 Se llevó a cabo una prueba clínica para determi- 
nar si cierto tipo de vacuna tiene un efecto sobre la in- 
cidencia de cierta enfermedad. Una muestra de 1000 
ratas, 500 de las cuales recibieron la vacuna, se mantu- 
vo en un ambiente controlado durante un periodo de un 
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año. En el grupo que no fue vacunado, 120 ratas presen- 
taron la enfermedad, mientras que en el grupo inocula- 
do 98 ratas la contrajeron. Si p, es la probabilidad de 
incidencia de la enfermedad en las ratas sin vacuna y p, 
es la probabilidad de incidencia en las ratas inoculadas, 
calcule un intervalo de confianza del 90% para р, — p,. 


9.68 Еп el estudio Germination and Emergence of 
Broccoli, realizado por el Departamento de horticultura 
del Virginia Tech, un investigador encontró que a 5°С, 
de 20 semillas de brócoli germinaron 10; en tanto que a 
15°С, de 20 semillas germinaron 15. Calcule un inter- 
valo de confianza del 95% para la diferencia en la pro- 
porción de semillas que germinaron a las dos 
temperaturas y decida si esta diferencia es significativa. 


9.69 Una encuesta de 1000 estudiantes reveló que 
274 eligen al equipo profesional de beisbol A como su 
equipo favorito. En 1991 se realizó una encuesta simi- 
lar con 760 estudiantes y 240 de ellos también eligieron 
a ese equipo como su favorito. Calcule un intervalo de 
confianza del 95% para la diferencia entre la propor- 
ción de estudiantes que favorecen al equipo A en las 
dos encuestas. ¿Hay una diferencia significativa? 


9.70 Ре acuerdo con el USA Today (17 de marzo de 
1997), las mujeres constituían el 33.7% del personal 
de redacción en las estaciones locales de televisión en 
1990 y el 36.2% en 1994. Suponga que en 1990 y 
en 1994 se contrataron 20 nuevos empleados para el 
personal de redacción. 

a) Estime el número de trabajadores que habrían sido 
mujeres en 1990 y en 1994, respectivamente. 

b) Calcule un intervalo de confianza del 95% para 
saber si hay evidencia de que la proporción de mu- 
jeres contratadas para el equipo de redacción fue 
mayor en 1994 que en 1990. 


9.12 Una sola muestra: estimación de la varianza 


Si extraemos una muestra de tamaño n de una población normal con varianza о? y cal- 
culamos la varianza muestral s?, obtenemos un valor del estadístico 52. Esta varianza 
muestral calculada se utiliza como una estimación puntual de o°. En consecuencia, al 
estadístico 5? ѕе le denomina estimador de с? 

Se puede establecer una estimación por intervalos de 0?utilizando el estadístico 


X? 


(п — 1)52 


De acuerdo соп el teorema 8.4, cuando las muestras se toman de una población normal 
el estadístico X? tiene una distribución chi cuadrada con n — 1 grados de libertad. Pode- 


mos escribir (véase la figura 9.7) 


Pap <Х? < ҳар) = 1-0, 
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@/2 0/2 


2 2 
0 Ха -0/2 Xa/2 


Figura 9.7: P(Xi-an< x’ < Xaj) =1-@. 


donde X ав y Хар son valores de Ја distribución chi cuadrada con n — 1 grados de 
libertad, que dejan áreas de 1 – 2/2 y 2/2, respectivamente, а la derecha. Al sustituir 
рага X?’ escribimos 
(п — 1)52 
Р | ir хав <р | = 1-0. 


Si dividimos cada término de la desigualdad entre (п — 1)5?, y después invertimos cada 
término (lo que cambia el sentido de las desigualdades), obtenemos 

— 1)? — 135? 
(05 «ote UE е 


Р 2 
Хар Xi-a/2 


Para una muestra aleatoria de tamaño n, tomada de una población normal, se calcula la va- 
rianza muestral s? y se obtiene el siguiente intervalo de confianza del 100(1 – a)% para o°. 


Intervalo de Si s*es la varianza de una muestra aleatoria de tamaño п de una población normal, un 
confianza para 0? intervalo de confianza del 100(1 – @)% para о? es 


(п = Ds? тз (п = 1)52 
Хв Mila 


donde ж? ny Xx a/2 SOn valores xX? con v = п— 1 grados de libertad, que dejan áreas 
de 0/2 y 1 - @/2, respectivamente, a la derecha. 


> 


Un intervalo de confianza aproximado a 100(1 ~ @)% para с se obtiene tomando la 
raíz cuadrada de cada extremo del intervalo para o°. 


Ejemplo 9.18: | Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribui- 
das por cierta empresa: 46.4, 46.1, 45.8, 47.0, 46.1. 45.9, 45.8, 46.9, 45.2 y 46.0. Calcule 
un intervalo de confianza del 95% para la varianza de todos los pesos de este tipo de pa- 
quetes de semillas de pasto distribuidos por la empresa. Suponga una población normal. 

Solución: Primero calculamos a a 2 
n Dat- (ә) 


2 i=l 
n(n — 1) 


s“ = 
(10)(21,273.12) — (461.2)? 
100) 
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Para obtener un intervalo de confianza del 95% elegimos а = 0.05. Después, usando la 
tabla А.5 con v = 9 grados de libertad, encontramos od = 19.023 y Mosa = 2.700. 
Por lo tanto, el intervalo de confianza del 95% рага о? es 


(910.286), (9X0.286) 
19.023 SI S270 > 


o simplemente 0.135 < о? < 0.953. 2 


9.13 Dos muestras: estimación de la proporción 
de dos varianzas 


. АУ: А Я 4 2 
Una estimación puntual de la proporción de dos varianzas de la población 02/03 es 
dada por la proporción 52 / 52 de las varianzas muestrales. En consecuencia, el estadístico 


2 . 
52 /55 se conoce como un estimador de 04/03. 

Si оі y с son las varianzas de poblaciones normales, podemos establecer una es- 
timación por intervalos de 0/0? usando el estadístico 


625? 
= oz 
9155 


De acuerdo con el teorema 8.8, la variable aleatoria F tiene una distribución F con v, = 
n,-1 y v, =n,- 1 grados de libertad. Por lo tanto, podemos escribir (véase la figura 9.8) 


Plfi-a/2(V1,V2) < F < fa/2(v1,v2)]] = 1 — Q, 


donde ў _„ np Y fa nr v,) son los valores de la distribución F con v, y v, grados de 
libertad, que dejan áreas de 1 – 2/2 y 2/2, respectivamente, a la derecha. 


@/2 а /2 
0 fi—a/2 fa/2 


Figura 9.8: PIf1-a/2(V1,V2) <F < fa/2(v1,v2)] = 1-а. 
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Al sustituir para F, escribimos 


©? 2 


551 
21 < Е = 1-а 


P | a/2(v1,V2) < 0252 


Si multiplicamos cada término de la desigualdad por $3 /5?, y después invertimos cada 
término, obtenemos 


E 1 ¿HU S 1 |= _ 
52 ар (у, 0) 93 ` Sifi-a/2(V1,V2) 


Los resultados del teorema 8.7 nos permiten reemplazar Іа cantidad f _,, ‚ә v,) por 
1/ў, pa v,). Por lo tanto, 


St 1 ст Si 
< < Ја/20%2,у1)| =1—@ 
ESO эњ) `0} $$ 
Para cualesquiera dos muestras aleatorias independientes de tamaño n, у п, que se selec- 
cionan de dos poblaciones normales, se calcula la proporción de las varianzas Е 
52 /52 y se obtiene el siguiente intervalo de confianza del 100(1 – а)% para 04/03. 


Intervalo de Si s? y s3 son las varianzas de muestras independientes de tamaño n, y n, respectiva- 
confianza „рага mente, tomadas de poblaciones normales, entonces un intervalo de confianza del 
2 
04/03 100(1 – а)% para 0/07 es 


2 2 2 
51 1 oi 5{ 
2 z < Tfa/2(V2)V1), 
s3faj2lv1,V2) 05 55 


donde f, 2/2 (у у,)еѕ un valor f con v, = л – 1 y v, = п, – 1 grados de libertad que deja 
una área de а/2 а la derecha, y f, 0/2 (, v ) es un valor f similar conv, =n, - уу = п, 
— 1 grados de libertad. 


Como vimos en la sección 9.12, tomando la raíz cuadrada de cada extremo del in- 
tervalo рага 09/03, se obtiene un intervalo de confianza del 100(1 – 0)% para 0/0, 


Ejemplo 9.19: | En el ejemplo 9.12 de la página 290 se construyó un intervalo de confianza para la dife- 
rencia en el contenido medio de ortofósforo de dos estaciones ubicadas sobre el río 
James, medido en miligramos por litro, suponiendo que las varianzas normales de la 
población son diferentes. Justifique esta suposición construyendo intervalos de confianza 
del 98% para 01/02 y para 0,/0,, donde oi y 9 son las varianzas de la población del 
contenido de ortofósforo en la estación 1 y en la estación 2, respectivamente. 
Solución: Del ejemplo 9.12 tenemos n, = 15, n, = 12, s, = 3.07 y s, = 0.80. Para un intervalo de 
confianza del 98%, а = 0. 02. Al interpolar eñ la tabla А. 6 encontramos fooll4, е 
4.30 у 7,011.14) = 3.87. Por lo tanto, el intervalo de confianza del 98% para с 2/03 es 


300P 1 с2 (3.07 
(сах) (=) < 2 < (сах) В 
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que se simplifica a 3.425 <2 = i< 56.991. Al calcular las raíces cuadradas de los límites 


de confianza encontramos К un intervalo de confianza del 98% para с, /0, es 


1.851 <=” — < 7.549. 


0 


Como este intervalo no permite la posibilidad de que с/с, sea igual a 1, es correcto 
suponer que O, С, о с? + 05 en el ejemplo 9.12. 2 


Ejercicios 

9.71 Un fabricante de baterías para automóvil afirma 
que sus baterías durarán, en promedio, 3 años con una 
varianza de 1 año. Suponga que 5 de estas baterías tie- 
nen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 años y con 
base en esto construya un intervalo de confianza del 
95% para о?, después decida si la afirmación del fabri- 
cante de que о? = 1 es válida. Suponga que la pobla- 
ción de duraciones de las baterías se distribuye de 
forma aproximadamente normal. 


9.72 Una muestra aleatoria de 20 estudiantes obtuvo 
una media de х = 72 y una varianza de 5° = 16 en un 
examen universitario de colocación en matemáticas. 
Suponga que las calificaciones se distribuyen normal- 
mente y con base en esto construya un intervalo de con- 
fianza del 98% para o°. 


9.73 Construya un intervalo de confianza del 95% 
para 0? en el ejercicio 9.9 de la página 283. 


9.74 Construya un intervalo de confianza del 99% 
para 0? en el ejercicio 9.11 de la página 283. 


9.75 Construya un intervalo de confianza del 99% 
para сер el ejercicio 9.12 de la página 283. 


9.76 Construya un intervalo de confianza del 90% 
para сеп el ejercicio 9.13 de la página 283. 


9.77 Construya un intervalo de confianza del 98% 
рага с, /0, en el ejercicio 9.42 de la página 295, donde 
с, y ©, son, respectivamente, las desviaciones estándar 
para las distancias recorridas por litro de combustible 
de los camiones compactos Volkswagen y Toyota. 


9.78 Construya un intervalo de confianza del 90% 
para 04/07 en el ejercicio 9.43 DE la página 295. ¿Se 
justifica que supongamos que сї + 0% cuando cons- 
truimos nuestro intervalo de confianza para џ, — и? 


9.79 Construya un intervalo de confianza del 90% 
para 04/03 en el ejercicio 9.46 de la página 295. ¿De- 
beríamos suponer que сї = 0% cuando construimos 
nuestro intervalo de confianza para 4, — р,? 


9.80 Construya un intervalo de confianza del 95% 
para Сд 1 Jož en el ejercicio 9.49 de la página 295. 
¿Tendría que utilizar la suposición de la igualdad de la 
varianza? 


9.14 Estimación de la máxima verosimilitud (opcional) 


A menudo los estimadores de parámetros han tenido que recurrir a la intuición. El esti- 
mador X ciertamente parece razonable como estimador de una media de la población p. 
La virtud де 5? сото estimador de о? se destaca en el estudio de estimadores insesgados 
de la sección 9.3. El estimador para un parámetro binomial p es simplemente una pro- 
porción de la muestra que, desde luego, es un promedio y recurre al sentido común. Sin 
embargo, hay muchas situaciones en las que no es del todo evidente cuál debería ser el 
estimador adecuado. Como resultado, el estudiante de estadística tiene mucho que 
aprender respecto a las diferentes filosofías que producen distintos métodos de estima- 
ción. En esta sección estudiaremos el método de máxima verosimilitud. 

La estimación por máxima verosimilitud representa uno de los métodos de estima- 
ción más importantes en toda la estadística inferencial. No explicaremos el método de 
manera detallada; más bien, intentaremos transmitir la filosofía de la máxima verosimi- 
litud e ilustrarla con ejemplos que la relacionan con otros problemas de estimación que 
se examinan en este capítulo. 
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Función de verosimilitud 


Como el nombre lo indica, el método de máxima verosimilitud es aquel para el que se 
maximiza la función de verosimilitud, lo cual se ilustra mejor con un ejemplo que inclu- 
ye una distribución discreta у un solo parámetro. Consideremos que Х,, X,,..., Х, son las 
variables aleatorias independientes tomadas de una distribución de probabilidad discreta 
representada por f(x, 0), donde Ө es un solo parámetro de la distribución. Ahora bien, 


L(x1,X2),...,Xn30) =f (1,X2,...,Xn3 0) 
=f (x1, Of (x2,0) ·:: (х, 0) 


es la distribución conjunta de las variables aleatorias, la cual a menudo se denomina 
función de probabilidad. Observe que la variable de la función de probabilidad es Ө, no 
х. Represente con Xp Хун X, los valores observados en una muestra. En el caso de una 
variable aleatoria discreta, la interpretación es muy clara. La cantidad Lx, e T Ж; Ө), 
la verosimilitud de la muestra, es la siguiente probabilidad conjunta: 


Р(Хү =x1,X2 =X2,...,Xp = х, 10), 


que es la probabilidad de obtener los valores muestrales Xp Хун Xy Para el caso discre- 
to el estimador de máxima verosimilitud es el que da como resultado un valor máximo 
para esta probabilidad conjunta, o el que maximiza la probabilidad de la muestra. 

Considere un ejemplo ficticio en el cual se inspeccionan tres artículos que salen de 
una línea de ensamble. Los artículos se clasifican como defectuosos o no defectuosos, 
de manera que se aplica el proceso de Bernoulli. La inspección de los tres artículos da 
como resultado dos artículos no defectuosos seguidos por uno defectuoso. Nos interesa 
estimar p, la proporción de artículos no defectuosos en el proceso. La probabilidad de la 
muestra para este ejemplo es dada por 


p:p.a=pPq=p -p, 


donde q = 1 – р. La estimación de máxima verosimilitud daría un estimado de p para el 
que se maximiza la verosimilitud. Resulta claro que si diferenciamos la verosimilitud 
respecto a p, igualamos la derivada a cero y la resolvemos, obtenemos el valor 


„_ 2 
рта 


Entonces, desde luego, en esta situación р = 2/3 es la proporción muestral defec- 
tuosa y, por ello, un estimador razonable de la probabilidad de un artículo defectuoso. El 
lector debería intentar comprender que la filosofía de la estimación de máxima verosimi- 
litud proviene de la noción de que el estimador razonable de un parámetro que se basa 
en información muestral es el valor del parámetro que produce la mayor probabilidad 
de obtener la muestra. Ésta es, de hecho, la interpretación para el caso discreto, ya que 
la verosimilitud es la probabilidad de observar de manera conjunta los valores en la 
muestra. 

Así, mientras que la interpretación de la función de verosimilitud como una proba- 
bilidad conjunta se limita al caso discreto, la noción de máxima verosimilitud se ex- 
tiende a la estimación de parámetros de una distribución continua. Presentamos ahora 
una definición formal de la estimación de máxima verosimilitud. 
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Definición 9.3: 
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Dadas las observaciones independientes x,, x,,..., х, de una función de densidad de 
probabilidad (caso continuo) o de una función de masa de probabilidad (caso discreto) 
Fx, 0), el estimador de máxima verosimilitud Ê es el que maximiza la función de pro- 
babilidad 


BOAS 25050 Xn; 0) =$ (x;0) =$ (1,0) (2, 0) ri / (An, Ө). 

Muy a menudo conviene trabajar con el logaritmo natural de la función de verosi- 
militud para encontrar el máximo de esa función. Considere el siguiente ejemplo acerca 
del parámetro u de una distribución de Poisson. 


Ejemplo 9.20: | Considere una distribución de Poisson con la siguiente función de masa de probabilidad 


Solución: 


И: 


x! 


fa A. х =0,1,2,.... 


Suponga que se toma una muestra aleatoria x,, x,,..., х, de la distribución. ¿Cuál es 
la estimación de máxima verosimilitud de и? 


La función de probabilidad es 
| п ко, 
L(X1,X2,-.-,X = Пе» = Г 
Considere ahora 
InL(x¡,Xx2,...,X n; H) = пи E 
i=l i=l 
КЕЕ Е" Dž 


Resolver para ITA el estimador de máxima verosimilitud, implica definir la derivada para 
cero y resolver para el parámetro. Por consiguiente, 


= Х. 


з [9 


La segunda derivada de la función de verosimilitud logarítmica es negativa, lo cual im- 
plica que la solución anterior realmente es un máximo. Como и es la media de la distri- 
bución de Poisson (capítulo 5), el promedio muestral en realidad parecería ser un estima- 
dor razonable. J 

El siguiente ejemplo presenta el uso del método de máxima verosimilitud para cal- 
cular estimados de dos parámetros. Simplemente encontramos los valores de los pará- 
metros que maximizan (de forma conjunta) la función de probabilidad. 


Ejemplo 9.21: | Considere una muestra aleatoria Xp» Жуз Ж, de una distribución normal N(u, с). Calcule 


los estimadores de máxima verosimilitud para и y 0”. 
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Solución: La función de verosimilitud para la distribución normal es 


n 2 
А ŽS 1 1 х= р 
L(x1,X2,...,X n; h, 0") = aaay ®®Р = > (2) | 


i=1 


Al usar logaritmos obtenemos 


1 n x= 2 
InL(x1,x2,...,Xxn34,0?) = -5 m27) — Ino? 2 SY (E 2) | 


ї=1 


Рог 1о їапїо, 


п 


дш _ п 1 2 
da 262° ози Y 10”. 


i=l 


Al igualar ambas derivadas a cero, obtenemos 


n 


Sa -nu =0 y no? = Уо; =H 


і=1 і=1 


Por consiguiente, el estimador de máxima verosimilitud de р es dado por 


= Ss к=; 


i=1 


que es un resultado satisfactorio, ya que ¥ ha desempeñado un papel tan importante en 
este capítulo como un estimador puntual de и. Por otro lado, el estimador de máxima 
verosimilitud de с? es 


1 n 
22 y 59, 
e == х; = Хх). 
п ( ) 


і=1 


Al verificar la matriz derivada parcial de segundo orden se confirma que la solución da 
como resultado el máximo de la función de verosimilitud. 2 

Resulta interesante notar la distinción entre el estimador de máxima verosimilitud 
de a? y el estimador insesgado $? que se presentó al principio de este capítulo. Los nu- 
meradores son idénticos, desde luego, y el denominador lo constituyen los “grados de 
libertad” n — 1 para el estimador insesgado, y n para el estimador de máxima verosimili- 
tud. Los estimadores de máxima verosimilitud no necesariamente gozan de la propiedad 
de carecer de sesgo. Sin embargo, los estimadores de máxima verosimilitud tienen im- 
portantes propiedades asintóticas. 


Ejemplo 9.22: | Suponga que en un estudio biomédico se utilizan 10 ratas а las que después de inyectarles 


células cancerosas se les suministra un fármaco contra el cáncer diseñado para aumentar 
su tasa de supervivencia. Los tiempos de supervivencia, en meses, son 14, 17, 27, 18, 12, 
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Solución: 


8, 22, 13, 19 y 12. Suponga que se trata de una distribución exponencial. Calcule un es- 
timado de máxima verosimilitud de la supervivencia media. 


Del capítulo 6 sabemos que la función de densidad de probabilidad para la variable alea- 
toria exponencial X es 


FG, 6) = dll к=, 


0, en cualquier caso. 


Por consiguiente, la función de verosimilitud logarítmica de los datos, dado que n = 
10, es 


10 
1 
In L(x1,x2,...,x1038) = —10 1n 8 — 825% 
i=l 


Si se establece que 


дш. 10. 1х 
= — + Xi = 0 
ш Р 


implica que 


[S 


10 

Ê= Y xi =7 = 16.2. 
і=1 
Si se evalúa Іа segunda derivada de la función de verosimilitud logarítmica en el valor Ê 
anterior se produce un valor negativo. Como resultado, el estimador del parámetro , la 
media de la población, es el promedio muestral х. 

El siguiente ejemplo ilustra el estimador de máxima verosimilitud para una distribu- 
ción que no se incluye en los capítulos anteriores. 


1 


о 


Ejemplo 9.23: | Se sabe que una muestra que consta de los valores 12, 11.2, 13.5, 12.3, 13.8 y 11.9 pro- 


Solución: 


viene de una población con la siguiente función de densidad 


Ө 
AT 1 
(х; 0) = ЕЯ , х > 


0, en cualquier caso, 


donde 0 > 0. Calcule la estimación de máxima verosimilitud de Ө. 


La función de verosimilitud de n observaciones de esta población se escribe como 


n 
0 ө" 
L(x1 х2,...010:0 = | [ = 
* 2 0+1 n O+1 ? 
i=1 vi СП 10% 


lo cual implica que 


InL(x1,x2,...,x1038) = n In(0) — (0 + D $ a) 


i=l 
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n 
art = 5 — У In(x;) da como resultado 


ї=1 


Si establecemos que 0 = 


n 


Y) хо) 


ї=1 


ĝ = 


= E =0 .3970 
—1n(12) + In(11.2) + 1n(13.5) + In(12.3) + In(13.8) +In(11.9) ` ` 


Como la segunda derivada de L es —n /6?, que siempre es negativa, la función de proba- 
bilidad alcanza su valor máximo en Ө. И | 


Comentarios adicionales respecto a la estimación 
de máxima verosimilitud 


Ejercicios 


Un análisis detallado de las propiedades de la estimación de máxima verosimilitud está 
fuera del alcance de este libro y, por lo general, es un tema importante en un curso teórl- 
co de estadística inferencial. El método de máxima verosimilitud permite al analista 
utilizar el conocimiento de la distribución para determinar un estimador adecuado. El 
método de máxima verosimilitud no se puede aplicar si no se conoce la distribución 
subyacente. En el ejemplo 9.21 aprendimos que el estimador de máxima verosimilitud 
no necesariamente carece de sesgo. El estimador de máxima verosimilitud es insesgado 
asintóticamente o en el límite; es decir, la magnitud del sesgo se aproxima a cero a me- 
dida que la muestra se hace más grande. Al principio de este capítulo examinamos la 
noción de eficacia, que se vincula con la propiedad de la varianza de un estimador. Los 
estimadores de máxima verosimilitud tienen propiedades de varianza deseables en el 
límite. El lector debería consultar la obra de Lehmann y D”Abrera (1998) para más 
detalles. 


9.81 Suponga que hay п ensayos x,, х,,..., х, de un 
proceso de Bernoulli con parámetro p, la probabilidad 
de un éxito. Esto es, la probabilidad de r éxitos es dada 
por (») Р(1— р). Determine el estimador de máxima 
verosimilitud para el parámetro p. 


9.82 Considere la distribución logarítmica normal 
con la función de densidad dada en la sección 6.9. Su- 
ponga que tiene una muestra aleatoria x, x,..., х, de 
una distribución logarítmica normal. 
a) Escriba la función de verosimilitud. 
b) Desarrolle los estimadores de máxima verosimili- 
tud de y y 07. 


9.83 Considere una muestra aleatoria de x,,..., x, ob- 
tenida de la distribución gamma descrita en la sección 
6.6. Suponga que conoce el parámetro о, el cual diga- 
mos que es 5, y con base en esto determine la estima- 
ción de máxima verosimilitud para el parámetro 9. 


9.84 Considere una muestra aleatoria de x,, X,,..., X, 
observaciones de una distribución de Weibull con pará: 
metros & y 8, y la siguiente función de densidad 


Ше < 


0, en cualquier caso, 


para a, 8 > 0. 
a) Escriba la función de verosimilitud. 
b) Escriba las ecuaciones que al resolverse propor- 
cionan los estimadores de máxima verosimilitud 


de q y В. 


9.85 Considere una muestra aleatoria de x.,..., х, Ob- 
tenida de una distribución uniforme U(O, Ө), con el pa- 
rámetro Ө desconocido, donde Ө > 0. Determine el 
estimador de máxima verosimilitud de 0. 


9.86 Considere las observaciones independientes de 
Xp Xy +», X, de la distribución gamma que se analizó en 
la sección 6.6. 


Ejercicios de repaso 


a) Escriba la función de verosimilitud. 

b) Escriba un conjunto de ecuaciones que, cuando se 
resuelven, proporcionan los estimadores de máxi- 
ma verosimilitud de с y 8. 


9.87 Considere un experimento hipotético en el que 
un hombre que tiene un hongo utiliza un medicamento 
fungicida y se cura. Por lo tanto, considere que se trata 
de una muestra de una distribución de Bernoulli con la 
siguiente función de probabilidad 


Д/о)у=р q7, x=0,1, 


Ejercicios de repaso 


9.89 Considere dos estimadores de о? рага una 

muestra X,, х,,..., х, que se extrae de una distribución 

normal con media р y varianza o°. Los estimadores son 
п 


el estimador insesgado 52 = = Nx; — xy y el es- 
izl 
n 
timador de máxima verosimilitud 6? = 1 > Ot xy. 
i=l 


Analice las propiedades de la varianza de estos dos es- 
timadores. 


9.91 Se afirma que un individuo podrá reducir, en un 
lapso de 2 semanas, un promedio de 4.5 kilogramos de 
peso con una nueva dieta. Los pesos de 7 mujeres que 
siguieron esta dieta se registraron antes y después de un 
periodo de 2 semanas. 


Mujer Peso antes Peso después 
1 58.5 60.0 
2 60.3 54.9 
3 61.7 58.1 
4 69.0 62.1 
5 64.0 58.5 
6 62.6 59.9 
7 56.7 54.4 


Pruebe la afirmación sobre la dieta calculando un inter- 
valo de confianza del 95% para la diferencia media en 
el peso. Suponga que las diferencias de los pesos se 
distribuyen de forma aproximadamente normal. 


9.92 En Virginia Tech se realizó un estudio para de- 
terminar si se puede utilizar el fuego como una herra- 
mienta de control viable para aumentar la cantidad de 
forraje disponible para los venados durante los meses 
críticos a finales del invierno y principios de la prima- 
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donde p es la probabilidad de un éxito (curación) y 
q = 1 – p. Ahora, desde luego, la información mues- 
tral da x = 1. Escriba un procedimiento que demuestre 
que p = 1.0 es el estimador de máxima probabilidad 
de curación. 


9.88 Considere la observación X de la distribución 
binomial negativa dada en la sección 5.4. Calcule el 
estimador de máxima verosimilitud para p, suponiendo 
que se conoce К. 


vera. El calcio es un elemento necesario para las plan- 
tas y los animales. La cantidad que la planta toma y 
almacena está estrechamente correlacionada con la 
cantidad presente en el suelo. Se formuló la hipótesis 
de que el fuego podría cambiar los niveles de calcio 
presentes en el suelo y, por lo tanto, influir en la canti- 
dad disponible para los venados. Se seleccionó una ex- 
tensión grande de tierra en el bosque Fishburn para 
provocar un incendio controlado. Justo antes de la que- 
ma se tomaron muestras de suelo de 12 parcelas con la 
misma área y se analizaron para verificar su contenido 
de calcio. Después del incendio se volvieron a analizar 
los niveles de calcio en las mismas parcelas. Los valo- 
res obtenidos, en kilogramos por parcela, se presentan 
en la siguiente tabla: 


Nivel de calcio (kg/parcela) 


Parcela Antes Después 
del incendio del incendio 


1 50 9 
2 50 18 
3 82 45 
4 64 18 
5 82 18 
6 73 9 
7 77 32 
8 54 9 
9 23 18 
10 45 9 
11 36 9 
12 54 9 


Construya un intervalo de confianza del 95% para la 
diferencia media en los niveles de calcio presentes en el 
suelo antes y después del incendio controlado. Supon- 
ga que la distribución de las diferencias en los niveles 
de calcio es aproximadamente normal. 


9.93 El dueño de un gimnasio afirma que una persona 
podrá reducir, en un periodo de 5 días, un promedio de 
2 centímetros en su talla de cintura con un nuevo pro- 
grama de ejercicios. En la siguiente tabla se presentan 
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las tallas de cintura de 6 hombres que participaron en 
este programa de ejercicios antes y después del periodo 
de 5 días: 


Talla de cintura Talla de cintura 


Hombre antes | después 
1 90.4 91.7 
2 95.5 93.9 
3 98.7 97.4 
4 115.9 112.8 
5 104.0 101.3 
6 85.6 84.0 


Mediante el cálculo de un intervalo de confianza del 
95% para la reducción media en la talla de cintura de- 
termine si la afirmación del dueño del gimnasio es váli- 
da. Suponga que la distribución de las diferencias en 
las tallas de cintura antes y después del programa es 
aproximadamente normal. 


9.95 Se llevó a cabo un experimento para determinar 
si el acabado superficial tiene un efecto en el límite de 
resistencia a la fatiga del acero. Una teoría indica que el 
pulido aumenta el límite medio de resistencia a la fatiga 
(para la flexión inversa). Desde un punto de vista prác- 
tico, el pulido no debería tener efecto alguno sobre la 
desviación estándar del límite de resistencia a la fatiga, 
el cual se sabe, a partir de la realización de diversos 
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experimentos de límite de resistencia a la fatiga, que es 
de 4000 psi. Se realiza un experimento sobre acero al 
carbono al 0.4% usando especímenes sin pulido y espe- 
címenes con pulido suave. Los datos son los siguientes: 


Límite de fatiga (psi) 
Acero Acero al carbono 


al carbono al 0.4% _al 0.4% sin pulir 
85,500 82,600 
91,900 82,400 
89,400 81,700 
84,000 79,500 
89,900 79,400 
78,700 69,800 
87,500 79,900 
83,100 83,400 


Calcule un intervalo de confianza del 95% para la dife- 
rencia entre las medias de la población para los dos mé- 
todos. Suponga que las poblaciones se distribuyen de 
forma aproximadamente normal. 


9.96 Un antropólogo está interesado en determinar la 
proporción de individuos de dos tribus indias que tie- 
nen doble remolino de cabello en la zona occipital. Su- 
ponga que toma muestras independientes de cada una 
de las dos tribus y encuentra que 24 de 100 indivi- 
duos de la tribu A y 36 de 120 individuos de la tribu B 
poseen tal característica. Construya un intervalo de 
confianza del 95% para la diferencia p, — p, entre las 
proporciones de estas dos tribus con remolinos de ca- 
bello en la zona occipital. 


9.97 Un fabricante de planchas eléctricas produce es- 
tos artículos en dos plantas en las que las partes peque- 
ñas son surtidas por el mismo proveedor. El fabricante 
puede ahorrar algo si le compra a un proveedor local 
los termostatos para la planta B. Para probar si estos 
nuevos termostatos son tan precisos como los anterio- 
res le compra sólo un lote al proveedor local y los prue- 
ba en planchas a 550°F. Al final lee con un termopar las 
temperaturas reales y las redondea al siguiente 0.1°Е 
más cercano. Los datos son los siguientes: 


Proveedor nuevo (°F) 


530.3 559.3 5494 5440 551.7 566.3 
549.9 556.9 5367 558.8 538.8 543.3 
559.1 555.0 538.6 551.1 565.4 554.9 
550.0 554.9 5547 536.1 569.1 
Proveedor anterior (F) 
559.7 5347 554.8 545.0 544.6 538.0 
550.7 563.1 551.1 553.8 538.8 564.6 
554.5 553.0 538.4 548.3 552.9 535.1 
555.0 544.8 5584 5487 560.3 


Calcule un intervalo de confianza de 95% para с2/02 
у para d,/0,, donde сі y 0% son las varianzas de la 


Ejercicios de repaso 


población de las lecturas de los termostatos del provee- 
dor nuevo y del anterior, respectivamente. 


9.99 Una forma alternativa de estimación se lleva a 
cabo a través del método de momentos. El método con- 
siste en igualar la media y la varianza de la población 
con las correspondientes media muestral х y varianza 
muestral s?, y resolver para los parámetros; el resultado 
son los estimadores por momentos. En el caso de un 
solo parámetro sólo se utilizan las medias. Argumente 
por qué en el caso de la distribución de Poisson el esti- 
mador de máxima verosimilitud y los estimadores por 
momentos son iguales. 


9.100 Especifique los estimadores por momentos 
para u y с? para la distribución normal. 


9.101 Especifique los estimadores por momentos 
para u y 0? para la distribución logarítmica normal. 


9.102 Especifique los estimadores por momentos 
para Q y В en el caso de la distribución gamma. 


9.103 Se realizó una encuesta con el fin de comparar 
los sueldos de administradores de plantas químicas em- 
pleados en dos áreas del país: el norte y el centro-occi- 
dente. Se eligió una muestra aleatoria independiente de 
300 gerentes de planta para cada una de las dos áreas. 
A tales gerentes se les preguntó el monto de su sueldo 
anual. Los resultados fueron los siguientes: 


Centro- 
Norte Occidente 
ху = $102,300 х› = $98, 500 
sı = $5700 s2 = $3800 


a) Construya un intervalo de confianza del 99% para 
L, — H, la diferencia en los sueldos medios. 

¿Qué supuso en el inciso a) acerca de la distribu- 
ción de los sueldos anuales para las dos áreas? ¿Es 
necesaria la suposición de normalidad? Explique 
su respuesta. 

¿Qué supuso acerca de las dos varianzas? ¿Es ra- 
zonable la suposición de igualdad de varianzas? 
¡Explique! 


b) 


с) 
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9.104 Considere el ejercicio de repaso 9.103. Supon- 
ga que los datos aún no se han recabado. Suponga tam- 
bién que los estadísticos previos sugieren que С, = 0, 
= $4000. ¿Los tamaños de las muestras en el ejercicio 
de repaso 9.103 son suficientes para producir un inter- 
valo de confianza del 95% si pu, — p, tiene una anchura 
de sólo $1000? Presente el desarrollo completo. 


9.105 Un sindicato se preocupa por el notorio ausen- 
tismo de sus miembros. Los líderes del sindicato siem- 
pre habían afirmado que, en un mes típico, el 95% de 
sus afiliados estaban ausentes menos de 10 horas al 
mes. El sindicato decide verificar esto revisando una 
muestra aleatoria de 300 de sus miembros. Se registra 
el número de horas de ausencia para cada uno de los 
300 miembros. Los resultados son ¥ = 6.5 horas y s = 
2.5 horas. Utilice los datos para responder esa afirma- 
ción utilizando un límite de tolerancia unilateral y eli- 
giendo un nivel de confianza del 99%. Asegúrese de 
aplicar lo que ya sabe acerca del cálculo del límite 
de tolerancia. 


9.107 Remítase al ejercicio de repaso 9.106. Suponga 
que se desea saber si la estimación puntual р = 8/30 es 
lo suficientemente precisa porque el intervalo de con- 
fianza alrededor de p no es tan estrecho como se requiere. 
Utilice р como el estimado de р para determinar cuán- 
tas empresas habría que incluir en una muestra para 
obtener un intervalo de confianza del 95% con una an- 
chura de sólo 0.05. 


9.108 Un fabricante produce un artículo que se clasi- 
fica como “defectuoso” o “no defectuoso”. Para esti- 
mar la proporción de productos defectuosos se tomó 
una muestra aleatoria de 100 artículos de la producción 
y se encontraron 10 defectuosos. Después de aplicar un 
programa de mejoramiento de la calidad se volvió a 
realizar el experimento. Se tomó una nueva muestra de 
100 artículos y esta vez sólo 6 salieron defectuosos. 

a) Dado un intervalo de confianza del 95% de p, — p,, 
donde p, y p, representan la proporción de artícu- 
los defectuosos de la población antes y después 
del mejoramiento, respectivamente. 

b) ¿Hay información en el intervalo de confianza que 
se encontró en el inciso a) que sugiera que p, > 
p,? Explique su respuesta. 
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9.109 Se utiliza una máquina para llenar cajas de un 
producto en una operación de la línea de ensamble. 
Gran parte del interés se centra en la variabilidad del 
número de onzas del producto en la caja. Se sabe que la 
desviación estándar en el peso del producto es de 0.3 
onzas. Se realizan mejoras y luego se toma una muestra 
aleatoria de 20 cajas, y se encuentra que la varianza de la 
muestra es de 0.045 onzas?. Calcule un intervalo de 
confianza del 95% de la varianza del peso del producto. 
Si considera el rango del intervalo de confianza, ¿le pa- 
rece que el mejoramiento en el proceso incrementó la 
calidad en lo que se refiere a la variabilidad? Suponga 
normalidad en la distribución del peso del producto. 


9.110 Un grupo de consumidores está interesado en 
comparar los costos de operación de dos diferentes ti- 
pos de motor para automóvil. El grupo encuentra 15 
propietarios cuyos automóviles tienen motor tipo A y 
15 que tienen motor tipo B. Los 30 propietarios com- 
praron sus automóviles más o menos al mismo tiempo 
y todos llevaron buenos registros en cierto periodo de 
12 meses. Los consumidores encontraron, además, que 
los propietarios recorrieron aproximadamente el mis- 
mo número de millas. Los estadísticos de costo son 
Ja = $87.00/1000 millas, y, = $75.00/1000 millas, 
s, = $5.99 y s, = $4.85. Calcule un intervalo de con- 
fianza del 95% para estimar 4, -Hp la diferencia en el 
costo medio de operación. Suponga normalidad y va- 
rianzas iguales. 


9.111 Considere el estadístico 5 E el estimado agrupa- 
do de о? que se estudió en la sección 9.8 y que se utiliza 
cuando se está dispuesto a suponer que сї = оз = о?. 
Demuestre que el estimador es insesgado para о? [es de- 
cir, demuestre que ECS?) = 02]. Puede utilizar los resul- 
tados de cualquier teorema o ejemplo de este capítulo. 


9.112 Un grupo de investigadores del factor humano 
están interesados en saber cómo reaccionan los pilotos 
aviadores ante un estímulo dispuesto de cierta manera 


9.15 
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en la cabina del avión. Para lograr su objetivo realiza- 
ron un experimento de simulación en un laboratorio, el 
cual incluyó a 15 pilotos, los que presentaron un tiem- 
po de reacción promedio de 3.2 segundos y una desvia- 
ción estándar muestral de 0.6 segundos. Resulta de 
interés caracterizar el extremo, es decir, el escenario 
del peor caso. Para conseguir esto realice lo siguiente: 

a) Determine un importante límite de confianza uni- 
lateral específico del 99% del tiempo medio de 
reacción. ¿Qué suposición, si la hubiera, debería 
hacer acerca de la distribución de los tiempos de 
reacción? 

b) Determine un intervalo unilateral de predicción 
del 99% e interprete su significado. ¿Debería usted 
suponer algo sobre la distribución de los tiempos 
de reacción para calcular este límite? 

c) Calcule un límite de tolerancia unilateral con una 
confianza del 99% que incluya al 95% de los tiem- 
pos de reacción. Nuevamente, de ser necesario, 
interprete o suponga algo acerca de la distribu- 
ción. [Nota: Los valores del límite de tolerancia 
unilateral también se incluyen en la tabla A.7]. 


9.113 Cierto proveedor fabrica un tipo de tapete de 
hule que vende a las empresas automotrices. El mate- 
rial que utiliza para los tapetes debe tener ciertas carac- 
terísticas de dureza. Ocasionalmente detecta tapetes 
defectuosos en el proceso y los rechaza. El proveedor 
afirma que la proporción de tapetes defectuosos es de 
0.05, pero como un cliente que compró los tapetes de- 
safió su afirmación, realizó un experimento en el que se 
probaron 400 tapetes y se encontraron 17 defectuosos. 

a) Calcule un intervalo de confianza bilateral del 
95% de la proporción de tapetes defectuosos. 

b) Calcule un intervalo de confianza unilateral del 
95% adecuado de la proporción de tapetes defec- 
tuosos. 

c) Interprete los intervalos de ambos incisos y comen- 
te acerca de la afirmación hecha por el proveedor. 


Posibles riesgos y errores conceptuales: 


relación con el material de otros capítulos 


El concepto de intervalo de confianza de muestra grande en una población a menudo 
confunde a los alumnos principiantes. Se basa en la idea de que incluso cuando se des- 
conoce су no se está convencido de que la distribución que se muestrea es normal, se 
puede calcular un intervalo de confianza para y a partir de 
$ 
Хх + 10 з=. 
yn 
En la práctica es común que se utilice esta fórmula cuando la muestra es demasiado 
pequeña. El origen de este intervalo de muestra grande es, por supuesto, el teorema del 
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límite central (TLC), con el cual la normalidad no es necesaria. Aquí el TLC requiere 
una с conocida, de la cual s sólo es un estimado. Por lo tanto, n debe ser al menos tan 
grande como 30 y la distribución subyacente debe tener una simetría similar, en cuyo 
caso el intervalo sigue siendo una aproximación. 

Hay casos en que la aplicación práctica del material de este capítulo depende en 
gran medida del contexto específico. Un ejemplo muy importante es el uso de la distri- 
bución г para el intervalo de confianza de р cuando se desconoce с. En términos estric- 
tos, el uso de la distribución t requiere que la distribución de donde se toma la muestra 
sea normal. Sin embargo, es bien sabido que cualquier aplicación de la distribución t es 
razonablemente insensible, es decir, robusta, a la suposición de normalidad. Esto repre- 
senta una de esas situaciones afortunadas que ocurren con frecuencia en el campo de la 
estadística, donde no se sostiene un supuesto básico y “¡todo resulta bien!” Sin embargo, 
la población de la que se toma la muestra no se puede desviar mucho de la normalidad. 
Por consiguiente, a menudo se recurrirá a las gráficas de probabilidad normal estudiadas 
en el capítulo 8 y las pruebas de bondad del ajuste que se presentarán en el capítulo 10 
para atribuir algún sentido de “cercanía a la normalidad”. Esta idea de “robustez a la 
normalidad” se volverá a presentar en el capítulo 10. 

Por experiencia sabemos que uno de los más graves “usos incorrectos de la estadís- 
tica” en la práctica surge de la confusión sobre las diferencias en la interpretación de los 
tipos de intervalos estadísticos. Por consiguiente, la subsección de este capítulo en la que 
se examinan las diferencias entre los tres tipos de intervalos es importante. Es muy pro- 
bable que en la práctica se utilice en exceso el intervalo de confianza, es decir, que se 
emplee cuando no es la media lo que interesa en realidad, sino la cuestión de: “¿en dónde 
va a caer la siguiente observación?”, o la a menudo más importante cuestión de: “¿en 
dónde se ubica la mayor parte de la distribución?” Éstas son preguntas fundamentales 
que no se pueden responder calculando un intervalo de la media. A menudo resulta con- 
fusa la interpretación de un intervalo de confianza. Es tentador concluir que hay una 
probabilidad de 0.95 de que el parámetro caiga dentro del intervalo. Aunque se trata de 
una interpretación correcta del intervalo posterior bayesiano (para mayores referencias 
sobre la inferencia bayesiana véase el capítulo 18), no es una interpretación adecuada de 
la frecuencia. 

El intervalo de confianza tan sólo sugiere que si se realiza el experimento y los datos 
se observan una y otra vez, aproximadamente 95% de tales intervalos contendrá el pará- 
metro verdadero. Cualquier alumno principiante de la estadística práctica debería tener 
muy claras las diferencias entre estos intervalos estadísticos. 

Otro posible y grave uso incorrecto de la estadística es el que se cometería si se 
aplicara la distribución x? a un intervalo de confianza de una sola varianza. De nuevo, 
se supone normalidad en la distribución de donde se toma la muestra. A diferencia del 
resultado de utilizar la distribución т, la prueba X? para esta aplicación no es robusta 
para la suposición de normalidad (esto significa que cuando la distribución subyacente 


(п—1)5 
о? 


. . ., 2 
no es normal, la distribución muestral de se aparta mucho de X°). En consecuen- 


cia, el uso estricto de la prueba de bondad de ajuste (véase el capítulo 10) y de las grá- 
ficas de probabilidad normal, o de la prueba y las gráficas, puede ser muy importante en 
esos contextos. En los siguientes capítulos se proporcionará más información sobre este 
tema general. 


Capítulo 10 


Pruebas de hipótesis de una 
y dos muestras 


10.1 Hipótesis estadísticas: conceptos generales 


Definición 10.1: 


Como se expuso en el capítulo 9, a menudo el problema al que se enfrentan el científico 
o el ingeniero no es tanto la estimación de un parámetro de la población, sino la for- 
mación de un procedimiento de decisión que se base en los datos y que pueda producir 
una conclusión acerca de algún sistema científico. Por ejemplo, un investigador médico 
puede decidir con base en evidencia experimental si beber café incrementa el riesgo de 
cáncer en los seres humanos; un ingeniero quizá tenga que decidir con base en datos 
muestrales si hay una diferencia entre la precisión de un tipo de medidor y la de otro; o 
tal vez un sociólogo desee reunir los datos apropiados que le permitan decidir si el tipo de 
sangre y el color de ojos de un individuo son variables independientes. En cada uno 
de estos casos el científico o el ingeniero postulan o conjeturan algo acerca de un sis- 
tema. Además, cada uno debe utilizar datos experimentales y tomar decisiones basadas 
en ellos. En cada caso la conjetura se puede expresar en forma de hipótesis estadística. 
Los procedimientos que conducen a la aceptación o al rechazo de hipótesis estadísticas 
como éstas comprenden una área importante de la inferencia estadística. Empecemos 
por definir con precisión lo que entendemos por hipótesis estadística. 


Una hipótesis estadística es una aseveración o conjetura respecto a una o más pobla- 
ciones. 


La verdad o falsedad de una hipótesis estadística nunca se sabe con absoluta certeza, 
a menos que se examine toda la población, lo cual, por supuesto, sería poco práctico en 
la mayoría de las situaciones. En vez de eso se toma una muestra aleatoria de la pobla- 
ción de interés y se utilizan los datos contenidos en ella para proporcionar evidencia 
que respalde o no la hipótesis. La evidencia de la muestra que es inconsistente con la 
hipótesis planteada conduce al rechazo de la misma. 
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El papel que desempeña la probabilidad en la prueba de hipótesis 


Debería quedar claro al lector que un procedimiento de toma de decisiones debe implicar 
la conciencia de la probabilidad de llegar a una conclusión errónea. Por ejemplo, su- 
ponga que la hipótesis que postuló el ingeniero es que la fracción p de artículos defectuo- 
sos en cierto proceso es 0.10. El experimento consiste en observar una muestra aleatoria 
del producto en cuestión. Suponga que se prueban 100 artículos y que se encuentran 12 
defectuosos. Es razonable concluir que esta evidencia no rechaza la condición de que el 
parámetro binomial p = 0.10, por lo que puede provocar que no se rechace la hipótesis. 
Sin embargo, también puede provocar que no se refute p = 0.12, o quizá incluso p = 
0.15. Como resultado, el lector se debe acostumbrar a la idea de que el rechazo de una 
hipótesis implica que fue refutada por la evidencia de la muestra. En otras palabras, 
el rechazo significa que existe una pequeña probabilidad de obtener la información 
muestral observada cuando, de hecho, la hipótesis es verdadera. Por ejemplo, en la 
hipótesis de la proporción de artículos defectuosos, una muestra de 100 artículos que 
revela que hay 20 defectuosos es ciertamente evidencia para el rechazo. ¿Por qué? Si 
en realidad p = 0.10, la probabilidad de obtener 20 o más artículos defectuosos es 
aproximadamente de 0.002. Con el pequeño riesgo resultante de llegar a una conclusión 
errónea parecería seguro rechazar la hipótesis de que p = 0.10. En otras palabras, el 
rechazo de una hipótesis tiende a casi “descartar” la hipótesis. Por otro lado, es muy im- 
portante enfatizar que la aceptación o, más bien, la falta de rechazo no descarta otras po- 
sibilidades. Como resultado, el analista de datos establece una conclusión firme cuando 
se rechaza una hipótesis. 

En el planteamiento formal de una hipótesis a menudo influye la estructura de la 
probabilidad de una conclusión errónea. Si el científico está interesado en apoyar firme- 
mente un argumento, espera llegar a éste en la forma del rechazo de una hipótesis. Si el 
investigador médico desea mostrar evidencia sólida a favor del argumento de que beber 
café aumenta el riesgo de contraer cáncer, la hipótesis a probar debería tener la forma 
“el riesgo de desarrollar cáncer no aumenta como consecuencia de beber café”. Como 
resultado, el argumento se obtiene mediante un rechazo. De manera similar, para apoyar 
la afirmación de que un tipo de medidores es más preciso que otro, el ingeniero prueba la 
hipótesis de que no hay diferencia en la precisión de los dos tipos de medidores. 

Lo anterior implica que cuando el analista de datos formaliza la evidencia experi- 
mental con base en la prueba de hipótesis, es muy importante el planteamiento formal 
de la hipótesis. 


La hipótesis nula y la hipótesis alternativa 


La estructura de la prueba de hipótesis se establece usando el término hipótesis nula, el 
cual se refiere a cualquier hipótesis que se desea probar y se denota con H. El rechazo de 
Н conduce a la aceptación de una hipótesis alternativa, que se denota con Н. La com- 
prensión de las diferentes funciones que desempeñan la hipótesis пша (Н) y la hipótesis 
alternativa (Н) es fundamental para entender los principios de la prueba de hipótesis. 
La hipótesis alternativa A, por lo general representa la pregunta que se responderá o la 
teoría que se probará, por lo que su especificación es muy importante. La hipótesis nula 
H, anula o se opone a Н, y a menudo es el complemento lógico de Н. A medida que el 
lector aprenda más sobre la prueba de hipótesis notará que el analista llega a una de las 
siguientes dos conclusiones: 
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rechazar HA, a favor de H А debido а evidencia suficiente en los datos о 
no rechazar Н, debido a evidencia insuficiente en los datos. 


Observe que las conclusiones no implican una “aceptación de Н,” formal y literal. La 
aseveración de H, a menudo representa el “status quo” contrario a una nueva idea, conje- 
tura, etcétera, enunciada en A; en tanto que no rechazar H, representa la conclusión ade- 
cuada. En nuestro ejemplo binomial la cuestión práctica podría ser el interés en que la 
probabilidad histórica de artículos defectuosos de 0.10 ya no sea verdadera. De hecho, 
la conjetura podría ser que p excede a 0.10. Entonces podríamos afirmar que 


Ho: p = 0.10, 
Н\:р > 0.10. 


Ahora, 12 artículos defectuosos de cada 100 no refutan p = 0.10, por lo que la conclu- 
sión es “no rechazar H,”. Sin embargo, si los datos revelan 20 artículos defectuosos de 
cada 100, la conclusión sería “rechazar H a favor de H:p> 0.10. 

Aunque las aplicaciones de la prueba de hipótesis son muy abundantes en trabajos 
científicos y de ingeniería, quizás el mejor ejemplo para un principiante sea el dilema 
que enfrenta el jurado en un juicio. Las hipótesis nula y alternativa son 


H; el acusado es inocente, 
H: el acusado es culpable. 


La acusación proviene de una sospecha de culpabilidad. La hipótesis H, (el status quo) 
se establece en oposición a H, y se mantiene a menos que se respalde H, con evidencia 
“más allá de una duda razonable”. Sin embargo, en este caso “no rechazar Н no im- 
plica inocencia, sino sólo que la evidencia fue insuficiente para lograr una condena. Por 
lo tanto, el jurado no necesariamente acepta H, sino que no rechaza H. 


10.2 Prueba de una hipótesis estadística 


Para ilustrar los conceptos que se utilizan al probar una hipótesis estadística acerca de 
una población considere el siguiente ejemplo. Se sabe que, después de un periodo de dos 
años, cierto tipo de vacuna contra un virus que produce resfriado ya sólo es 25% eficaz. 
Suponga que se eligen 20 personas al azar y se les aplica una vacuna nueva, un poco más 
costosa, para determinar si protege contra el mismo virus durante un periodo más largo. 
(En un estudio real de este tipo el número de participantes que reciben la nueva vacuna 
podría ascender a varios miles. Aquí la muestra es de 20 sólo porque lo único que se 
busca es demostrar los pasos básicos para realizar una prueba estadística). Si más de 8 
individuos de los que reciben la nueva vacuna superan el lapso de 2 años sin contraer el 
virus, la nueva vacuna se considerará superior a la que se usa en la actualidad. El requi- 
sito de que el número exceda a 8 es algo arbitrario, aunque parece razonable, ya que re- 
presenta una mejoría modesta sobre las 5 personas que se esperaría recibieran protección 
si fueran inoculadas con la vacuna que actualmente está en uso. En esencia probamos la 
hipótesis nula de que la nueva vacuna es igual de eficaz después de un periodo de 2 años 
que la que se utiliza en la actualidad. La hipótesis alternativa es que la nueva vacuna es 
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mejor, y esto equivale a poner a prueba la hipótesis de que el parámetro binomial para la 
probabilidad de un éxito en un ensayo dado es p = 1⁄4, contra la alternativa de que p > 1⁄4. 
Esto por lo general se escribe como se indica a continuación: 


H; p =0.25, 
H: p > 0.25. 


El estadístico de prueba 


El estadístico de prueba en el cual se basa nuestra decisión es X, el número de indivi- 
duos en nuestro grupo de prueba que reciben protección de la nueva vacuna durante un 
periodo de al menos 2 años. Los valores posibles de X, de O a 20, se dividen en dos gru- 
pos: los números menores o iguales que 8 y aquellos mayores que 8. Todos los posibles 
valores mayores que 8 constituyen la región crítica. El último número que observamos 
al pasar a la región crítica se llama valor crítico. En nuestro ejemplo el valor crítico es 
el número 8. Por lo tanto, si x > 8, rechazamos Ha favor de la hipótesis alternativa H i 
Si x < 8, no rechazamos Н. Este criterio de decisión se ilustra en la figura 10.1. 


No rechazar Ho Rechazar Ho 
(010:25) (р > 0.25) 


се _— _—— Є — ——————————х 
0123456 7 8 9101112131415 16 17 18 19 20 


Figura 10.1: Criterio de decisión para probar p = 0.25 contra p > 0.25. 


La probabilidad de un error tipo 1 


Definición 10.2: 


Definición 10.3: 


El procedimiento de toma de decisiones recién descrito podría conducir a cualquiera de 
dos conclusiones erróneas. Por ejemplo, es probable que la nueva vacuna no sea mejor 
que la que se usa en la actualidad (H, verdadera) y, sin embargo, en este grupo especí- 
fico de individuos seleccionados aleatoriamente más de 8 pasan el periodo de 2 años sin 
contraer el virus. Si rechazáramos На favor de Н | cuando, de hecho, H, es verdadera, 
cometeríamos un error que se conoce como error tipo I. 


El rechazo de la hipótesis nula cuando es verdadera se denomina error tipo I. 

Si 8 o menos miembros del grupo superan exitosamente el periodo de 2 años y no 
concluimos que la nueva vacuna es mejor cuando en realidad sí lo es (H, verdadera), 
cometemos un segundo tipo de error, el de no rechazar la hipótesis H, cuando en realidad 
es falsa. A este error se le conoce como error tipo II. 


No rechazar la hipótesis nula cuando es falsa se denomina error tipo П. 


Al probar cualquier hipótesis estadística, hay cuatro situaciones posibles que deter- 
minan si nuestra decisión es correcta o errónea. Estas cuatro situaciones se resumen en 
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la tabla 10.1. 


Tabla 10.1: Situaciones posibles al probar una hipótesis estadística. 


Н о es verdadera Ho es falsa 
No rechazar H y | Decisión correcta Error tipo II 
Rechazar H y | Error tipo I Decisión correcta 


La probabilidad de cometer un error tipo I, también llamada nivel de significancia, 
se denota con la letra griega (Y. En nuestro ejemplo un error tipo I ocurriría si más de 8 
individuos inoculados con la nueva vacuna superan el periodo de 2 años sin contraer el 
virus y los investigadores concluyen que la nueva vacuna es mejor, cuando en realidad 
es igual a la vacuna que se utiliza en la actualidad. Por lo tanto, si X es el número de 
individuos que permanecen sin contraer el virus por al menos dos años, 


20 
a 1 | 1 
а = Р(еггог tipo I) = Р(х > 8 cuando p = 1) = 2 e (= 20, 1) 
2 1 
=1- > b | x;20, = | = 1 — 0.9591 = 0.0409. 
x=0 6 5) 


Decimos que la hipótesis nula, p = 1/4, se prueba al nivel de significancia œ = 0.0409. 
En ocasiones el nivel de significancia se conoce como tamaño de la prueba. Una región 
crítica de tamaño 0.0409 es muy pequeña y, por lo tanto, es poco probable que se cometa 
un error de tipo I. En consecuencia, sería poco probable que más de 8 individuos perma- 
necieran inmunes a un virus durante 2 años utilizando una vacuna nueva que en esencia 
es equivalente a la que actualmente está en el mercado. 


La probabilidad de un error tipo П 


La probabilidad de cometer un error tipo П, que se denota con [, es imposible de calcu- 
lar a menos que tengamos una hipótesis alternativa específica. Si probamos la hipótesis 
nula p = 1/4 contra la hipótesis alternativa p = 1/2, entonces podremos calcular la pro- 
babilidad de no rechazar A, cuando es falsa. Simplemente calculamos la probabilidad 
de obtener 8 o menos en el grupo que supera el periodo de 2 años cuando p = 1/2. En 
este caso, 


1 
В = Р (error tipo П) = P (x < 8 cuando p = 5) 


E 1 
= уь (жж, 5) = 0.2517. 
х=0 


Se trata de una probabilidad elevada que indica un procedimiento de prueba en el cual es 
muy probable que se rechace la nueva vacuna cuando, de hecho, es mejor a la que está 
actualmente en uso. De manera ideal, es preferible utilizar un procedimiento de prueba 
con el cual haya pocas probabilidades de cometer el error tipo I y el error tipo П. 

Es posible que el director del programa de prueba esté dispuesto a cometer un 
error tipo II si la vacuna más costosa no es significativamente mejor. De hecho, la única 
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ocasión en la que desea evitar un error tipo П es cuando el verdadero valor de р es de al 
menos 0.7. Si p = 0.7, este procedimiento de prueba da 


В = P(error tipo П) = Р(Х < 8 cuando p = 0.7) 
8 
= 5 b(x; 20, 0.7) = 0.0051. 
x=0 


Con una probabilidad tan pequeña de cometer un error tipo П es muy improbable que 
se rechace la nueva vacuna cuando tiene una efectividad de 70% después de un periodo 
de 2 años. A medida que la hipótesis alternativa se aproxima a la unidad, el valor de 8 
tiende a disminuir hasta cero. 


El papel que desempeñan с, [З y el tamaño de la muestra 


Supongamos que el director del programa de prueba no está dispuesto a cometer un error 
tipo П cuando la hipótesis alternativa р = 1/2 es verdadera, aun cuando se encuentre que 
la probabilidad de tal error es @ = 0.2517. Siempre es posible reducir З aumentando el 
tamaño de la región crítica. Por ejemplo, considere lo que les sucede a los valores de 
а y B cuando cambiamos nuestro valor crítico а 7, de manera que todos los valores 
mayores que 7 caigan en la región crítica y aquellos menores o iguales que 7 caigan en 
la región de no rechazo. Así, al probar p = 1/4 contra la hipótesis alternativa p = 1/2, 
encontramos que 


20 7 
1 1 
а = > b (320, 1) =1- › b (5:20 1) = 1 — 0.8982 = 0.1018 


х= 8 х= 0 


7 
1 
p=Y'b (х:20 5) = 0.1316. 
x=0 


Al adoptar un nuevo procedimiento de toma de decisiones, reducimos la probabili- 
dad de cometer un error tipo П a costa de aumentar la probabilidad de cometer un error 
tipo I. Para un tamaño muestral fijo, una disminución en la probabilidad de un error por lo 
general tendrá como resultado un incremento en la probabilidad del otro error. Por for- 
tuna, la probabilidad de cometer ambos tipos de errores se puede reducir aumen- 
tando el tamaño de la muestra. Considere el mismo problema usando una muestra 
aleatoria de 100 individuos. Si más de 36 miembros del grupo superan el periodo de 2 
años, rechazamos la hipótesis nula de p = 1/4 y aceptamos la hipótesis alternativa de 
p > 1/4. El valor crítico ahora es 36. Todos los valores posibles mayores de 36 consti- 
tuyen la región crítica y todos los valores posibles menores o iguales que 36 caen en la 
región de aceptación. 

Para determinar la probabilidad de cometer un error tipo I debemos utilizar la 
aproximación a la curva normal con 


и = пр = (100) (3) =2 y o= pq = \/(100)(1/4)(3/4) = 4.33. 


Con respecto a la figura 10.2, necesitamos el área bajo la curva normal a la derecha 
de x = 36.5. El valor z correspondiente es 
_ 36.5 – 25 


= 2.66. 
4.33 
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с = 4.33 
Q 
e NY 
и =25 36.5 


Figura 10.2: Probabilidad de un error tipo 1. 


En la tabla A.3 encontramos que 
1 
а = P(error tipo I) = Р (x > 36 cuando p = 1) = P(Z > 2.66) 
=] — P(Z < 2.66) = 1 —0.9961 = 0 .0039. 


Si A, es falsa y el verdadero valor de Н, es р = 1/2, determinamos la probabilidad 
de un error tipo II usando la aproximación a la curva normal con 


Ш = пр = (100)(1/2) = 50 y o=ympq =y(1011/21/2)=5. 


La probabilidad de que un valor caiga en la región de no rechazo cuando H, es verdadera 

es dada por el área de la región sombreada a la izquierda de x = 36.5 en la figura 10.3. 

El valor z que corresponde a x = 36.5 es 
36550 _ 


Z —2.7. 
5 


Ho 
н; 
сё 4.33 


Figura 10.3: Probabilidad de un error tipo П. 


Por lo tanto, 


1 
В = P(error tipo П) = P (х < 36 cuando p = 5) = P(Z < -2.7) = 0.0035. 
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Evidentemente, los errores tipo I y tipo II rara vez ocurren si el experimento consta de 
100 individuos. 

El ejemplo anterior destaca la estrategia del científico en la prueba de hipótesis. 
Después de que se plantean las hipótesis nula y alternativa es importante considerar la 
sensibilidad del procedimiento de prueba. Con esto queremos decir que debería determi- 
narse un valor razonable a una о fija para la probabilidad de aceptar de manera errónea 
H,, es decir, el valor de 8, cuando la verdadera situación representa alguna desviación 
importante de H,. Por lo general, es posible determinar un valor para el tamaño de la 
muestra, para el que existe un equilibrio razonable entre los valores de œ y 8 que se 
calcula de esta manera. El problema de la vacuna es un ejemplo. 


Ilustración con una variable aleatoria continua 


Los conceptos que se analizan aquí para una población discreta también se pueden apli- 
car a variables aleatorias continuas. Considere la hipótesis nula de que el peso promedio 
de estudiantes hombres en cierta universidad es de 68 kilogramos, contra la hipótesis 
alternativa de que es diferente a 68. Es decir, deseamos probar 


H; и = 68, 
H: и # 68. 


La hipótesis alternativa nos permite la posibilidad de que u < 68 o u > 68. 

Una media muestral que caiga cerca del valor hipotético de 68 se consideraría como 
evidencia a favor de Hy Por otro lado, una media muestral considerablemente menor que 
o mayor que 68 sería evidencia en contra de H, y, por lo tanto, favorecería a H. La media 
muestral es el estadístico de prueba en este caso. Una región crítica para el estadístico de 
prueba se puede elegir de manera arbitraria como los dos intervalos ¥ < 67 y x > 69. La 
región de no rechazo será entonces el intervalo 67 < х < 69. Este criterio de decisión se 
ilustra en la figura 10.4. 


Rechazar Ho No rechazar Ho Rechazar Ho 
(14 68) (u = 68) (14 68) 


67 68 69 


Figura 10.4: Región crítica (en azul). 


Utilicemos ahora el criterio de decisión de la figura 10.4 para calcular las pro- 
babilidades de cometer los errores tipo I y tipo П cuando probemos la hipótesis nula u = 
68 kilogramos contra la alternativa u $ 68 kilogramos. 

Suponga que la desviación estándar de la población de pesos es с = 3.6. Para mues- 
tras grandes podemos sustituir s por с si no disponemos de ninguna otra estimación 
ае с. Nuestro estadístico de decisión, que se basa en una muestra aleatoria de tamaño 
п = 36, será X, el estimador más eficaz de u. Del teorema del límite central sabemos 
que la distribución muestral de Xes aproximadamente normal con desviación estándar 
0, =0//n = 3.6/6 = 0.6. 
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La probabilidad de cometer un error tipo Т, o el nivel de significancia de nuestra 
prueba, es igual a la suma de las áreas sombreadas en cada cola de la distribución en la 
figura 10.5. Por lo tanto, 


а = Р(Х < 67 cuando и = 68) + Р(Х > 69 cuando и = 68). 


Figura 10.5: Región crítica para probar и = 68 contra u + 68. 


Los valores z correspondientes а х = 67 у х, = 69 cuando H, es verdadera son 


67-68 69 — 68 
= = —1.67 = 
ds 0.6 Д БЕТ 


= 1.67. 


Por Іо tanto, 
а= P(Z < —1.67) + P(Z > 1.67) = 2P(Z < —1.67) = 0.0950. 


Por consiguiente, 9.5% de todas las muestras de tamaño 36 nos conducirían a rechazar 
и = 68 kilogramos cuando, de hecho, ésta es verdadera. Para reducir о tenemos que ele- 
gir entre aumentar el tamaño de la muestra o ampliar la región de no rechazo. Suponga 
que aumentamos el tamaño de la muestra a п = 64. Entonces су = 3.6/8 = 0.45. En 
consecuencia, 


_ 67-68 


_ 69—68 
Z1 = as = 


0.45 


=-22 y z =2.22. 


Por lo tanto, 
а = P(Z < -2.22) + P(Z > 2.22) = 2 P(Z < -2.22) = 0 .0264. 


La reducción de а no es suficiente por sí misma para garantizar un buen pro- 
cedimiento de prueba. Debemos evaluar 8 para varias hipótesis alternativas. Si es impor- 
tante rechazar H, cuando la media verdadera sea algún valor и > 70 o и < 66, entonces 
se debería calcular y examinar la probabilidad de cometer un error tipo П para las alter- 
nativas и = 66 y и = 70. Debido a la simetría, sólo es necesario considerar la probabi- 
lidad de no rechazar la hipótesis nula и = 68 cuando la alternativa и = 70 es verdadera. 
Cuando la media muestral х caiga entre 67 y 69, cuando Н , Sea verdadera, resultará un 
error tipo II. Por lo tanto, remitiéndonos a la figura 10.6 encontramos que 


B = Р(67 < X < 69 cuando и = 70). 


328 Capítulo 10 Pruebas de hipótesis de una y dos muestras 


Ho Н; 


Figura 10.6: Probabilidad del error tipo П al probar и = 68 contra и = 70. 


Los valores z que corresponden a х = 67 у х, = 69 cuando H, es verdadera son 


_67—70_ 69 — 70 


=-6.67 = =-2.22. 
0.45 у 2 дЕ 


Z1 


Por lo tanto, 
B = Р(—6.67 < Z < -2.22) = P(Z < -2.22) — P(Z < — 6.67) 
= 0.0132 — 0.0000 = 0.0132. 

Si el valor verdadero de и es la alternativa и = 66, el valor de [3 nuevamente será 
0.0132. Para todos los valores posibles de y < 66 o u > 70, el valor de 9 será incluso 
más pequeño cuando n = 64 y, en consecuencia, habrá poca oportunidad de no rechazar 
H, cuando sea falsa. 

La probabilidad de cometer un error tipo П aumenta rápidamente cuando el valor 
verdadero de и se aproxima al valor hipotético pero no es igual a éste. Desde luego, ésta 
suele ser la situación en la que no nos importa cometer un error tipo II. Por ejemplo, si 
la hipótesis alternativa и = 68.5 es verdadera, no nos importa cometer un error tipo Il al 


concluir que la respuesta verdadera es y = 68. La probabilidad de cometer tal error será 
elevada cuando n = 64. Al remitirnos a la figura 10.7, tenemos 


B = Р(67 < X < 69 cuando и = 68.5). 


Los valores z correspondientes a х, = 67 y х, = 69 cuando и = 68.5 son 
1 = 


Por lo tanto, 


B = Р(—3.33 < Z < 1.11) = P(Z < 1.11) — P(Z < -3.33) 
= 0.8665 — 0.0004 = 0.8661. 


Los ejemplos anteriores ilustran las siguientes propiedades importantes: 
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Ho Hı 


67 68 68.5 69 


Figura 10.7: Error tipo II para la prueba de u = 68 contra u = 68.5. 


Propiedades 
importantes 

de una prueba de 
hipótesis 


Definición 10.4: 


1. Los errores tipo I y tipo П están relacionados. Por lo general una disminución en 
la probabilidad de cometer uno da como resultado un incremento en la probabili- 
dad de cometer el otro. 


2. El tamaño de la región crítica y, por lo tanto, la probabilidad de cometer un error 
tipo Í, siempre se puede reducir ajustando el (los) valor(es) crítico(s). 


3. Un aumento еп el tamaño de la muestra п reducirá о y 8 de forma simultánea. 


4. Si la hipótesis nula es falsa, 8 es un máximo cuando el valor verdadero de un 
parámetro se aproxima al valor hipotético. Cuanto más grande sea la distancia 
entre el valor verdadero y el valor hipotético, más pequeña será [. 


La potencia de una prueba es la probabilidad de rechazar H, dado que una alternativa 
específica es verdadera. 


La potencia de una prueba se puede calcular сото 1 ~ 8. A menudo diferentes 
tipos de pruebas se comparan contrastando propiedades de potencia. Considere el 
caso anterior en el que probamos Н: и = 68 y Н: и + 68. Como antes, suponga que nos 
interesa evaluar la sensibilidad de la prueba, la cual es determinada por la regla de que 
no rechazamos H, si 67 < ¥ < 69. Buscamos la capacidad de la prueba para rechazar H, 
de manera adecuada cuando en realidad џи = 68.5. Vimos que la probabilidad de un error 
tipo П es dada por В = 0.8661. Por consiguiente, la potencia de la prueba es 1 — 0.8661 
= 0.1339. En cierto sentido, la potencia es una medida más sucinta de cuán sensible es 
la prueba para detectar diferencias entre una media de 68 y otra de 68.5. En este caso, 
si u es verdaderamente 68.5, la prueba como se describe rechazará de forma adecuada 
H, sólo 13.39% de las veces. Como resultado, la prueba no sería buena si es importante 
que el analista tenga una oportunidad razonable de distinguir realmente entre una media 
de 68.0 (que especifica H,) y una media de 68.5. De lo anterior resulta claro que para 
producir una potencia deseable, digamos, mayor que 0.8, es necesario incrementar о o 
aumentar el tamaño de la muestra. 

Hasta ahora gran parte del análisis de la prueba de hipótesis se ha enfocado en los 
principios y las definiciones. En las secciones que siguen seremos más específicos y 
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clasificaremos las hipótesis en categorías. También estudiaremos pruebas de hipótesis 
sobre varios parámetros de interés. Comenzamos estableciendo la diferencia entre hipó- 
tesis unilaterales y bilaterales. 


Pruebas de una y dos colas 


Una prueba de cualquier hipótesis estadística donde la alternativa es unilateral, como 


Ну: Ө = Ө, 
H: 0> UN 


O quizás 
Н: 0 = 0; 
Н:0< Ө, 


se denomina prueba de una sola cola. Anteriormente en esta sección se hizo referen- 
cia al estadístico de prueba para una hipótesis. Por lo general la región crítica para la 
hipótesis alternativa 0 > 0, yace en la cola derecha de la distribución del estadístico 
de prueba, en tanto que la región crítica para la hipótesis alternativa Ө < 0, yace por 
completo en la cola izquierda. (En cierto sentido el símbolo de desigualdad señala la 
dirección en donde se encuentra la región crítica). En el experimento de la vacuna se 
utilizó una prueba de una sola cola para probar la hipótesis p = 1/4 contra la alternativa 
unilateral p > 1/4 para la distribución binomial. La región crítica de una sola cola por 
lo general es evidente; el lector debería visualizar el comportamiento del estadístico de 
prueba y observar la señal evidente que produciría evidencia que respalde la hipótesis 
alternativa. 

La prueba de cualquier hipótesis alternativa donde la alternativa es bilateral, como 


H; 0 = Ө, 
H: 0+ Ө, 


se denomina prueba de dos colas, ya que la región crítica se divide en dos partes, a me- 
nudo con probabilidades iguales en cada cola de la distribución del estadístico de prueba. 
La hipótesis alternativa 0 + Ө, establece que Ө < Ө, o que Ө > Ө, Se utilizó una prueba 
de dos colas para probar la hipótesis nula y = 68 kilogramos contra la alternativa bilate- 
ral u $ 68 kilogramos en el ejemplo de la población continua de los pesos de estudiantes. 


¿Cómo se eligen las hipótesis nula y alternativa? 


Con frecuencia la hipótesis nula H, se plantea usando el signo de igualdad. Con este 
método se observa claramente cómo se controla la probabilidad de cometer un error tipo 
I. Sin embargo, hay situaciones en que “по rechazar Н implica que el parámetro Ө po- 
dría ser cualquier valor definido por el complemento natural de la hipótesis alternativa. 
Por ejemplo, en el caso de la vacuna, donde la hipótesis alternativa es Н: р > 1/4, es 
muy posible que el no rechazo de H, no pueda descartar un valor de p menor que 1/4. 
Sin embargo, es evidente que en el caso de las pruebas de una cola la consideración más 
importante es el planteamiento de la alternativa. 
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La decisión de plantear una prueba de una cola o una de dos colas depende de la con- 
clusión que se obtenga si se rechaza H,. La ubicación de la región crítica sólo se puede 
determinar después de que se plantea H. Por ejemplo, al probar una medicina nueva se 
establece la hipótesis de que no es mejor que las medicinas similares que actualmente 
hay en el mercado y se prueba contra la hipótesis alternativa de que la medicina nueva 
es mejor. Esta hipótesis alternativa dará como resultado una prueba de una sola cola, 
con la región crítica en la cola derecha. Sin embargo, si deseamos comparar una nueva 
técnica de enseñanza con el procedimiento convencional del salón de clases, la hipótesis 
alternativa debe permitir que el nuevo método sea inferior o superior al procedimiento 
convencional. Por lo tanto, la prueba sería de dos colas con la región crítica dividida en 
partes iguales, de manera que caiga en los extremos de las colas izquierda y derecha de 
la distribución de nuestro estadístico. 


Ejemplo 10.1: | Un fabricante de cierta marca de cereal de arroz afirma que el contenido promedio de 


Solución: 


grasa saturada no excede a 1.5 gramos por porción. Plantee las hipótesis nula y alterna- 
tiva que se utilizarán para probar esta afirmación y establezca en dónde se localiza la 
región crítica. 

La afirmación del fabricante se rechazará sólo si и es mayor que 1.5 miligramos y no se 
rechazará si u es menor o igual que 1.5 miligramos. Entonces, probamos 


H; u = 1.5, 
H: u> 1.5. 
El hecho de no rechazar H, no descarta valores menores que 1.5 miligramos. Como te- 


nemos una prueba de una cola, el símbolo mayor indica que la región crítica reside por 
completo en la cola derecha de la distribución de nuestro estadístico de prueba X. E 


Ejemplo 10.2: Un agente de bienes raíces afirma que 60% de todas las viviendas privadas que se cons- 


10.3 


Solución: 


truyen actualmente son casas con tres dormitorios. Para probar esta afirmación se ins- 
pecciona una muestra grande de viviendas nuevas. Se registra la proporción de las casas 
con 3 dormitorios y se utiliza como estadístico de prueba. Plantee las hipótesis nula y 
alternativa que se utilizarán en esta prueba y determine la ubicación de la región crítica. 
Si el estadístico de prueba fuera considerablemente mayor o menor que p = 0.6, recha- 
zaríamos la afirmación del agente. En consecuencia, deberíamos plantear las siguientes 
hipótesis: 


H; p = 0.6, 
Н:р+ 0.6. 


La hipótesis alternativa implica una prueba de dos colas con la región crítica dividida por 
igual en ambas colas de la distribución de P, nuestro estadístico de prueba. И | 


Uso de valores Р para la toma de decisiones en la prueba 
de hipótesis 


Al probar hipótesis en las que el estadístico de prueba es discreto, la región crítica se po- 
dría elegir de manera arbitraria y determinar su tamaño. Si œ es demasiado grande, se 
reduce haciendo un ajuste en el valor crítico. Quizá sea necesario aumentar el tamaño 
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de la muestra para compensar la disminución que ocurre de manera automática en la 
potencia de la prueba. 

Por generaciones enteras de análisis estadístico se ha vuelto costumbre elegir una @ 
de 0.05 о 0.01 y seleccionar la región crítica de acuerdo con esto. Entonces, desde luego, 
el rechazo o no rechazo estrictos de H, dependerá de esa región crítica. Por ejemplo, si 
la prueba es de dos colas, о se fija a un nivel de significancia de 0.05 y el estadístico de 
prueba implica, digamos, la distribución normal estándar, entonces se observa un valor z 
de los datos y la región crítica es 


z>19%6 о 2z<-—1.%, 


donde el valor 1.96 corresponde a Z, en la tabla А.З. Un valor de z en la región crítica 
sugiere la aseveración: “El valor del estadístico de prueba es significativo”, el cual se 
puede traducir al lenguaje del caso. Por ejemplo, si la hipótesis es dada por 


Ну и = 10, 
Н: u # 10, 


se puede decir: “La media difiere de manera significativa del valor 10”. 


Preselección de un nivel de significancia 


Esta preselección de un nivel de significancia о tiene sus raíces en la filosofía de que se 
debe controlar el riesgo máximo de cometer un error tipo I. Sin embargo, este enfoque 
no explica los valores del estadístico de prueba que están “cercanos” a la región crítica. 
Suponga, por ejemplo, que en el caso de Н: и = 10, contra Н: и + 10, se observa un 
valor z = 1.87. En términos estrictos, con @ = 0.05 el valor no es significativo; pero 
el riesgo de cometer un error tipo I si se rechaza H, en este caso difícilmente se podría 
considerar grave. De hecho, en una situación de dos colas, el riesgo se cuantifica como 


Р = 2Р(2 > 1.87 cuando р = 10) = 2(0.0307) = 0.0614. 


Como resultado, 0.0614 es la probabilidad de obtener un valor de z tan grande o ma- 
yor (en magnitud) que 1.87 cuando, de hecho, u = 10. Aunque esta evidencia en contra 
de A, no es tan firme como la que resultaría de un rechazo a un nivel а = 0.05, se trata 
de información importante para el usuario. De hecho, el uso continuo de  = 0.05 o 0.01 
tan sólo es un resultado de lo que los estándares han transmitido por generaciones. En 
la estadística aplicada los usuarios han adoptado de forma extensa el método del 
valor P. El método está diseñado para dar al usuario una alternativa (en términos de una 
probabilidad) a la mera conclusión de “rechazo” o “no rechazo”. El cálculo del valor P 
también proporciona al usuario información importante cuando el valor z cae dentro de 
la región crítica ordinaria. Por ejemplo, si z es 2.73, resulta informativo para el usuario 
observar que 


P = 2(0.0032) = 0.0064, 


y, por consiguiente, el valor z es significativo a un nivel considerablemente menor que 
0.05. Es importante saber que bajo la condición de H, un valor de z = 2.73 es un evento 
demasiado raro. А saber, un valor al menos tan grande en magnitud sólo ocurriría 64 
veces en 10,000 experimentos. 
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Demostración gráfica de un valor P 


Definición 10.5: 


Una manera muy simple de explicar gráficamente un valor P consiste en considerar dos 
muestras distintas. Suponga que se están considerando dos materiales para cubrir un tipo 
específico de metal con el fin de evitar la corrosión. Se obtienen especímenes y se cubre 
un grupo con el material 1 y otro grupo con el material 2. Los tamaños muestrales son 
n, = n, = 10 para cada muestra y la corrosión se mide en el porcentaje del área superfi- 
cial afectada. La hipótesis plantea que las muestras provienen de distribuciones comu- 
nes con media u = 10. Supongamos que la varianza de la población es 1.0. Entonces, 
probamos 


Ho: pı = ш = 10. 


Representemos con la figura 10.8 una gráfica de puntos de los datos. Los datos se 
colocan en la distribución determinada por la hipótesis nula. Supongamos que los datos 
“X?” se refieren al material 1 y que los datos “о” se refieren al material 2. Parece evidente 
que los datos realmente refutan la hipótesis nula. Pero, ¿cómo se podría resumir esto 
en un número? El valor P se puede considerar simplemente como la probabilidad 
de obtener este conjunto de datos dado que las muestras provienen de la misma 
distribución. Es evidente que esta probabilidad es muy pequeña, ¡digamos 0.00000001! 
Por consiguiente, el pequeño valor P evidentemente refuta Н, y la conclusión es que las 
medias de la población son significativamente diferentes. 


Figura 10.8: Datos que son probablemente generados de poblaciones que tienen dos 
medias diferentes. 


El uso del método del valor P como auxiliar en la toma de decisiones es muy na- 
tural y casi todos los programas de cómputo que proporcionan el cálculo de pruebas de 
hipótesis ofrecen valores Р, junto con valores del estadístico de prueba adecuado. La 
siguiente es una definición formal de un valor P. 


Un valor P es el nivel (de significancia) más bajo en el que el valor observado del esta- 
dístico de prueba es significativo. 


¿En qué difiere el uso de los valores P de la prueba de hipótesis clásica? 


En este momento resulta tentador resumir los procedimientos que se asocian con la 
prueba de, digamos, Н: 0 = 0, Sin embargo, el estudiante que es novato en esta área 
deberá tener en cuenta que hay diferencias entre el enfoque y la filosofía del método 
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clásico de а fija, que tiene su momento más importante en la conclusión de “rechazar 
H,” o “no rechazar Н” y el método del valor P. En este último no se determina una о fija 
y las conclusiones se obtienen con base en el tamaño del valor P, según la apreciación 
subjetiva del ingeniero o del científico. Aun cuando los modernos programas de cómputo 
proporcionan valores P, es importante que el lector comprenda ambos enfoques para 
apreciar la totalidad de los conceptos. Por lo tanto, ofrecemos una breve lista con los 
pasos del procedimiento tanto para el método clásico como para el del valor P. 


Aproximación a 
la prueba de 
hipótesis con 
probabilidad fija 
del error tipo I 


1. Establezca las hipótesis nula y alternativa. 
2. 
3. Seleccione un estadístico de prueba adecuado y establezca la región crítica con 


Elija un nivel de significancia о fijo. 


base en а. 


. Rechace H, si el estadístico de prueba calculado está en la región crítica. De otra 


manera, no rechace Н. 


. Saque conclusiones científicas y de ingeniería. 


Prueba de 
significancia 
(método del valor 
P) 


Ejercicios 


una 


. Establezca las hipótesis nula y alternativa. 

. Elija un estadístico de prueba adecuado. 

. Calcule el valor Р con base en los valores calculados del estadístico de prueba. 

. Saque conclusiones con base en el valor Р y los conocimientos del sistema cien- 


tífico. 


En secciones posteriores de este capítulo y en los capítulos siguientes muchos ejem- 
plos y ejercicios destacarán el método del valor P para obtener conclusiones científicas. 


10.4 Un fabricante de telas considera que la propor- 
ción de pedidos de materia prima que llegan con retraso 
es p = 0.6. Si una muestra aleatoria de 10 pedidos in- 
dica que 3 o menos llegaron con retraso, la hipótesis de 
que p = 0.6 se debería rechazar a favor de la alternativa 
р < 0.6. Utilice la distribución binomial. 
a) Calcule la probabilidad de cometer un error tipo I 
si la proporción verdadera es p = 0.6. 
b) Calcule la probabilidad de cometer un error tipo II 
para las alternativas p = 0.3, p = 0.4 y p = 0.5. 


10.5 Repita el ejercicio 10.4 pero suponga que se se- 
leccionan 50 pedidos y que se define a la región crítica 
como x < 24, donde x es el número de pedidos en la 
muestra que llegaron con retraso. Utilice la aproxi- 
mación normal. 


10.6 Se estima que la proporción de adultos que vive 


10.3 Se acusa a una empresa grande de discrimina- en una pequeña ciudad que son graduados universita- 


ción en sus prácticas de contratación. 


rios es p = 0.6. Para probar esta hipótesis se selecciona 


a) ¿Qué hipótesis se pone a prueba si un jurado co- una muestra aleatoria de 15 adultos. Si el número de 
mete un error tipo I al encontrar culpable a laem- graduados en la muestra es cualquier número entre 6 y 


presa? 


12, no rechazaremos la hipótesis nula de que p = 0.6; 


b) ¿Qué hipótesis se pone a prueba si un jurado co- Яе otro modo, concluiremos que р + 0.6. 
mete un error tipo П al encontrar culpable a laem- а) Evalúe о suponiendo que p = 0.6. Utilice la distri- 


presa? 


bución binomial. 


Ejercicios 


b) Evalúe В para las alternativas p = 0.5 ур = 0.7. 
c) ¿Es éste un buen procedimiento de prueba? 


10.7 Repita el ejercicio 10.6 pero suponga que se se- 
leccionan 200 adultos y que la región de no rechazo 
se define como 110 < x < 130, donde x es el número 
de individuos graduados universitarios en la muestra. 
Utilice la aproximación normal. 


10.8 En la publicación Relief from Arthritis de 
Thorsons Publishers, Ltd., John E. Croft afirma que 
más de 40% de los individuos que sufren de osteoartri- 
tis experimentan un alivio medible con un ingrediente 
producido por una especie particular de mejillón que 
se encuentra en la costa de Nueva Zelanda. Para probar 
esa afirmación se suministra el extracto de mejillón a 
un grupo de 7 pacientes con osteoartritis. Si 3 o más de 
los pacientes experimentan alivio, no rechazaremos la 
hipótesis nula de que p = 0.4; de otro modo, conclui- 
remos que p < 0.4. 

a) Evalúe а suponiendo que р = 0.4. 

b) Evalúe [В para la alternativa р = 0.3. 


10.11 Repita el ejercicio 10.8 pero suponga que el 
extracto de mejillón se administra a 70 pacientes y que 
la región crítica se define como x < 24, donde x es el 
número de pacientes con osteoartritis que experimen- 
tan alivio. 


10.12 Se pregunta a una muestra aleatoria de 400 vo- 
tantes en cierta ciudad si están a favor de un impuesto 
adicional de 4% sobre las ventas de gasolina con el fin de 
obtener los fondos que se necesitan con urgencia para la 
reparación de calles. Si más de 220 votantes, pero menos 
de 260 de ellos, favorecen el impuesto sobre las ventas, 
concluiremos que 60% de los votantes lo apoyan. 

a) Calcule la probabilidad de cometer un error tipo I 
si 60% de los votantes están a favor del aumento 
de impuestos. 

b) ¿Cuál es la probabilidad de cometer un error tipo 
IT al utilizar este procedimiento de prueba si en 
realidad sólo 48% de los votantes está a favor del 
impuesto adicional a la gasolina? 


10.13 Suponga que en el ejercicio 10.12 concluimos 
que 60% de los votantes está a favor del impuesto sobre 
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las ventas de gasolina si más de 214 votantes, pero me- 
nos de 266 de ellos, lo favorecen. Demuestre que esta 
nueva región crítica tiene como resultado un valor más 
pequeño рага о a costa de aumentar 9. 


10.14 Un fabricante desarrolla un nuevo sedal para 
pesca que, según afirma, tiene una resistencia media a 
la rotura de 15 kilogramos con una desviación estándar 
de 0.5 kilogramos. Para probar la hipótesis de que u = 
15 kilogramos contra la alternativa de que u < 15 kilo- 
gramos se prueba una muestra aleatoria de 50 sedales. 
La región crítica se define como x < 14.9. 
a) Calcule la probabilidad de cometer un error tipo I 
cuando H, es verdadera. 
b) Evalúe В para las alternativas и = 14.8 y u = 14.9 
kilogramos. 


10.15 En un restaurante de carnes una máquina de 
bebidas gaseosas se ajusta para que la cantidad de be- 
bida que sirva se distribuya de forma aproximadamente 
normal, con una media de 200 mililitros y una desvia- 
ción estándar de 15 mililitros. La máquina se verifica 
periódicamente tomando una muestra de 9 bebidas y 
calculando el contenido promedio. Si x cae en el inter- 
valo 191 < x < 209, se considera que la máquina opera 
de forma satisfactoria; de otro modo, se concluye que 
и # 200 mililitros. 
a) Calcule la probabilidad de cometer un error tipo I 
cuando и = 200 mililitros. 
b) Calcule la probabilidad de cometer un error tipo II 
cuando и = 215 mililitros. 


10.16 Repita el ejercicio 10.15 para muestras de ta- 
maño n = 25. Utilice la misma región crítica. 


10.17 Se desarrolla un nuevo proceso de cura para 
cierto tipo de cemento que da como resultado una re- 
sistencia media a la compresión de 5000 kilogramos 
por centímetro cuadrado y una desviación estándar de 
120 kilogramos. Para probar la hipótesis de que u = 
5000 contra la alternativa de que u < 5000 se toma una 
muestra aleatoria de 50 piezas de cemento. La región 
crítica se define como x < 4970. 
a) Calcule la probabilidad de cometer un error tipo І 
cuando H, es verdadera. 
b) Evalúe [В para las alternativas и = 4970 y u = 
4960. 


10.18 Si graficamos las probabilidades de no rechazar 
H, que corresponden a diversas alternativas para и (їп- 
cluido el valor especificado para H,) y conectamos to- 
dos los puntos mediante una curva suave, obtenemos la 
curva característica de operación del criterio de 
prueba o, simplemente, la curva CO. Observe que la 
probabilidad de no rechazar A, cuando es verdadera es 
simplemente 1 — а. Las curvas características de ope- 
ración se utilizan con amplitud en aplicaciones indus- 
triales para proporcionar una muestra visual de los 
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méritos del criterio de prueba. Remítase al ejercicio рага los siguientes 9 valores de u y grafique la curva 
10.15 y calcule las probabilidades de no rechazar H, СО: 184, 188, 192, 196, 200, 204, 208, 212 y 216. 


10.4 Una sola muestra: pruebas respecto a una sola media 


En esta sección consideramos de manera formal pruebas de hipótesis para una sola 
media de la población. Muchos de los ejemplos de las secciones anteriores incluyen 
pruebas sobre la media, por lo que el lector ya debería tener una idea de algunos de los 
detalles que aquí se describen. 


Pruebas para una sola media (varianza conocida) 


Primero deberíamos describir las suposiciones en las que se basa el experimento. El 
modelo para la situación subyacente se centra alrededor de un experimento con Х,, X,,..., 
Х „ que representan una muestra aleatoria de una distribución con media и y varianza 
o° > 0. Considere primero la hipótesis 


Нш = hy 
Hu F My 


El estadístico de prueba adecuado se debe basar en la variable aleatoria X. Enel capítulo 
8 se presentó el teorema del límite central, el cual establece en esencia que, sin importar 
la distribución de X, la variable aleatoria X tiene una distribución casi normal con media 
и у varianza с?/п para muestras de tamaño razonablemente grande. Por consiguiente, 
Mz = ну o; = o n. Podemos determinar, entonces, una región crítica basada en el 
promedio muestral calculado x. Ahora ya debería quedarle claro al lector que habrá una 
región crítica de dos colas para la prueba. 


Estandarización de X 


Es conveniente estandarizar Xe incluir de manera formal la variable aleatoria normal 
estándar Z, donde 


-ŠH 


on 


Z 


Sabemos que, bajo H, es decir, si и = u, entonces /n (5 — ш) /0 tiene una distribución 
n(x; O, 1) y, por lo tanto, la expresión 


Хх = 


se puede utilizar para escribir una región de no rechazo adecuada. El lector debería 
tener en la mente que, formalmente, la región crítica se diseña para controlar œ, la pro- 
babilidad de cometer un error tipo 1. Debería ser evidente que se necesita una señal de 
evidencia de dos colas para apoyar H. Así, dado un valor calculado х, la prueba formal 
implica rechazar H, si el estadístico de prueba z calculado cae en la región crítica que se 
describe a continuación. 
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Procedimiento de 
prueba para una 
sola media 
(varianza 
conocida) 


х — Ш х — Ш 
= ур > © o On < —Za/2 


Si -Z 2 < Z < т, по se rechaza Н. El rechazo de Н, desde luego, implica la aceptación 
de la hipótesis alternativa u = и. Con esta definición de la región crítica debería quedar 
claro que habrá о probabilidades de rechazar H, (al caer en la región crítica) cuando, en 
realidad, и = uy 


Aunque es más fácil entender la región crítica escrita en términos de 2, escribimos 
la misma región crítica en términos del promedio calculado x. Lo siguiente se puede 
escribir como un procedimiento de decisión idéntico: 


rechazar H, six <аох > b, 
donde 


с с 
ай, b = р + оу? ya 


En consecuencia, рага un nivel de significancia œ, los valores críticos de la variable 
aleatoria z y х se presentan en la figura 10.9. 


Q/2 Q/2 E 
a H b 


Figura 10.9: Región crítica para la hipótesis alternativa u # д. 


Las pruebas de hipótesis unilaterales sobre la media incluyen el mismo estadístico 
que se describe en el caso bilateral. La diferencia, por supuesto, es que la región crítica 
sólo está en una cola de la distribución normal estándar. Por ejemplo, supongamos que 
buscamos probar 


Нун = Hy 
Hiu > д 


La señal que favorece H, proviene de valores grandes de z. Así, el rechazo de H, resulta 
cuando se calcula z > т. Evidentemente, si la alternativa es H: и < д, la región crítica 
está por completo en la cola inferior, por lo que el rechazo resulta de z < —z, Aunque en 
el caso de una prueba unilateral la hipótesis nula se puede escribir como A; 4 < до Hy 
и > ц por lo general se escribe como H; 4 = Hy 

Los siguientes dos ejemplos ilustran pruebas de medias para el caso en el que se 
conoce С. 
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Ejemplo 10.3: | Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado reve- 


Solución: 


ló una vida promedio de 71.8 años. Si se supone una desviación estándar de la población 
de 8.9 años, ¿esto parece indicar que la vida media actual es mayor que 70 años? Utilice 
un nivel de significancia de 0.05. 


1. Ну; и = 70 años. 

2. Н: и > 70 años. 

3. а = 0.05. 

4. Región crítica: z > 1.645, donde z = 2718. 

5. Cálculos: x = 71.8 años, с = 8.9 años, еп consecuencia, z = 71.8 — 70 =2.02. 


8.9/./100 ~ 


6. Decisión: rechazar H, y concluir que la vida media actual es mayor que 70 años. 


El valor P que corresponde a z = 2.02 es dado por el área de la región sombreada en la 
figura 10.10. 
Si usamos la tabla A.3, tenemos 


P = P(Z > 2.02) = 0.0217. 


Como resultado, la evidencia a favor de H, es incluso más firme que la sugerida por un 
nivel de significancia de 0.05. 


Ejemplo 10.4: | Un fabricante de equipo deportivo desarrolló un nuevo sedal para pesca sintético que, 


Solución: 


según afirma, tiene una resistencia media a la rotura de 8 kilogramos con una desviación 
estándar de 0.5 kilogramos. Pruebe la hipótesis de que и = 8 kilogramos contra la alter- 
nativa de que и + 8 kilogramos si se prueba una muestra aleatoria de 50 sedales y se 
encuentra que tienen una resistencia media a la rotura de 7.8 kilogramos. Utilice un nivel 
de significancia de 0.01. 

. Ну: и = 8 kilogramos. 


. H: u + 8 kilogramos. 
. а = 0.01. 


. Región crítica: z < –2.575 y z > 2.575, donde z = Л 


. Cálculos: x = 7.8 kilogramos, п = 50, en consecuencia, 2 = 78-8 _ 


0.5/ J50 


. Decisión: rechazar H, y concluir que la resistencia promedio a la rotura no es igual 
a 8 sino que, de hecho, es menor que 8 kilogramos. 


=2.83. 


Dn Bb шо N = 


Como la prueba en este ejemplo es de dos colas, el valor de Р que se desea es el 
doble del área de la región sombreada en la figura 10.11 a la izquierda de z =-2.83. Por 
lo tanto, si usamos la tabla A.3, tenemos 


Р = Р(|2| > 2.83) = 2P(Z < —2.83) = 0.0046, 


que nos permite rechazar la hipótesis nula de que и = 8 kilogramos а un nivel de signi- 
ficancia menor que 0.01. 2 
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Р P/2 P/2 
0 2.02 2 283 0 283 * 
Figura 10.10: Valor P para el ejemplo 10.3. Figura 10.11: Valor P para el ejemplo 10.4. 


Relación con la estimación del intervalo de confianza 


El lector ya se habrá dado cuenta de que el método de la prueba de hipótesis para la 
inferencia estadística de este capítulo está muy relacionado con el método del intervalo 
de confianza del capítulo 9. La estimación del intervalo de confianza incluye el cálcu- 
lo de límites dentro de los cuales es “razonable” que resida el parámetro en cuestión. 
Para el caso de una sola media de la población y con о? conocida, la estructura tanto 
de la prueba de hipótesis como de la estimación del intervalo de confianza se basa en la 
variable aleatoria 

Х-и 

оп’ 


2 


Resulta que la prueba de Н: и = u, contra Н: и + u,a un nivel de significancia а es 
equivalente a calcular un intervalo de confianza del 100(1 — а)% sobre u y rechazar H, 
si u, está fuera del intervalo de confianza. Si и, está dentro del intervalo de confianza, no 
se rechaza la hipótesis. La equivalencia es muy intuitiva y se puede ilustrar de manera 
muy simple. Recuerde que con un valor observado x, no rechazar H, a un nivel de sig- 
nificancia Q implica que 


X 


mO 
с/т S Za/2> 


0/2 < 


que es equivalente a 


с 3 с 
< Ho = х ш ез 

La equivalencia de la estimación del intervalo de confianza con la prueba de hipó- 
tesis se extiende a las diferencias entre dos medias, varianzas, cocientes de varianzas, 
etcétera. Como resultado, el estudiante de estadística no debería considerar la estimación 
del intervalo de confianza y la prueba de hipótesis como formas separadas de inferencia 
estadística. Considere el ejemplo 9.2 de la página 271. El intervalo de confianza del 
95% sobre la media es dado por los límites (2.50, 2.70). Por consiguiente, con la misma 
información muestral, no se rechazará una hipótesis bilateral sobre u que incluya cual- 
quier valor hipotético entre 2.50 y 2.70. A medida que exploremos diferentes áreas de la 
prueba de hipótesis seguiremos aplicando la equivalencia a la estimación del intervalo 
de confianza. 
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Pruebas sobre una sola media (varianza desconocida) 


Ciertamente sospecharíamos que las pruebas sobre una media de la población u con о? 
desconocida, como la estimación del intervalo de confianza, deberían incluir el uso de 
la distribución г de Student. En términos estrictos, la aplicación de la т de Student tanto 
para los intervalos de confianza como para la prueba de hipótesis se desarrolla bajo los 
siguientes supuestos. Las variables aleatorias X p Xp- X, representan una muestra alea- 
toria de una distribución normal con u y т? desconocidas. Entonces, la variable aleatoria 
Vn(X — pu) / S tiene una distribución т de Student con n — 1 grados de libertad. La estruc- 
tura de la prueba es idéntica a la del caso en el que se conoce с, excepto que el valor o 
en el estadístico de prueba se reemplaza con el estimado calculado de $ y la distribución 
normal estándar se reemplaza con una distribución t. 


El estadístico t 
para una prueba 
sobre una sola 
media (varianza 
desconocida) 


Para la hipótesis bilateral 
Нун = hy 
H: u F Ho 


rechazamos На un nivel de significancia а cuando el estadístico і calculado 


cd 
s/y/n 


t 


excede a t o es menor que —Í 
а/2,п – 1 


aln- 1° 


El lector debería recordar de los capítulos 8 y 9 que la distribución г es simétrica alrede- 
dor del valor cero. Así, esta región crítica de dos colas se aplica de manera similar a la 
del caso en que se conoce с. Para la hipótesis bilateral a un nivel de significancia Q se 
aplican las regiones críticas de dos colas. Рага Н: и > u el rechazo resulta cuando ѓ > 
Ты; Para Ну: и < m la región crítica es dada por T < —1 


алп ап-1` 


Ejemplo 10.5: |El Edison Electric Institute publica cifras del número de kilowatts-hora que gastan 


Solución: 


anualmente varios aparatos electrodomésticos. Se afirma que una aspiradora gasta un 
promedio de 46 kilowatts-hora al año. Si una muestra aleatoria de 12 hogares, que se 
incluye en un estudio planeado, indica que las aspiradoras gastan un promedio de 42 
kilowatts-hora al año con una desviación estándar de 11.9 kilowatts-hora, ¿esto sugiere 
que las aspiradoras gastan, en promedio, menos de 46 kilowatts-hora al año a un nivel de 
significancia de 0.05? Suponga que la población de kilowatts-hora es normal. 

1. Н: и = 46 kilowatts-hora. 


2. H : и < 46 kilowatts-hora. 
3. а = 0.05. 
4. Región crítica: t < —1.796, donde t = TR con 11 grados de libertad. 
5. Cálculos: х = 42 kilowatts-hora, s = 11.9 kilowatts-hora y п = 12. 
En consecuencia, 
фы a Р = 116, P=P(T < -1.16) = 0.135. 


11.9/y12 
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6. Decisión: no rechazar H, y concluir que el número promedio de kilowatts-hora que 
gastan al año las aspiradoras domésticas no es significativamente menor que 46._1 


Comentario sobre la prueba ź de una sola muestra 


Es probable que el lector haya observado que se mantiene la equivalencia de la prueba t 
de dos colas para una sola media y el cálculo de un intervalo de confianza sobre u con o 
reemplazada por s. Considere el ejemplo 9.5 de la página 275. En esencia, podemos ver 
ese cálculo como uno en el que encontramos todos los valores de y, el volumen medio 
hipotético de contenedores de ácido sulfúrico para los que la hipótesis Н: и = u¿no se 
rechazará con о = 0.05. De nuevo, esto es consistente con el planteamiento: “si nos 
basamos en la información muestral, son razonables los valores del volumen medio de 
la población entre 9.74 y 10.26 litros”. 

En este punto vale la pena destacar algunos comentarios respecto a la suposición de 
normalidad. Indicamos que cuando se conoce с, el teorema del límite central permite 
utilizar un estadístico de prueba o un intervalo de confianza que se base en Z, la varia- 
ble aleatoria normal estándar. En términos estrictos, por supuesto, el teorema del límite 
central y, por lo tanto, el uso de la distribución normal estándar, no se aplica a menos 
que se conozca с. En el capítulo 8 se estudió el desarrollo de la distribución t. Ahí se 
estableció que la normalidad sobre Х,, X,,..., X, era una suposición subyacente. Entonces, 
en sentido estricto, no se deberían utilizar las tablas de г de Student de puntos porcentua- 
les para pruebas o intervalos de confianza, a menos que se sepa que la muestra proviene 
de una población normal. En la práctica rara vez se puede suponer una с conocida. Sin 
embargo, se dispondría de una buena estimación a partir de experimentos anteriores. 
Muchos libros de estadística sugieren que, cuando n > 30, es posible reemplazar con 
seguridad с por s en el estadístico de prueba 


2 00 


oyn 


con una población que tiene forma de campana y aun así utilizar las tablas Z para la 
región crítica adecuada. Aquí la implicación es que en realidad se recurre al teorema del 
límite central у que se confía en el hecho de que 5 ~ с. Evidentemente, cuando se hace 
esto el resultado debe considerarse como una aproximación. Por consiguiente, un valor 
P calculado (de la distribución Z) de 0.15 puede ser 0.12 o quizá 0.17; o un intervalo de 
confianza calculado puede ser un intervalo de 93% de confianza en vez de un intervalo 
de 95% como se desea. Entonces, ¿qué sucede en las situaciones donde n < 30? El usua- 
rio no puede confiar en que s se acerque a с, y para tomar en cuenta la inexactitud de la 
estimación el intervalo de confianza debería ser más ancho o el valor crítico de mayor 
magnitud. Los puntos porcentuales de la distribución £ logran esto, pero sólo son co- 
rrectos cuando la muestra proviene de una distribución normal. Desde luego, se pueden 
utilizar las gráficas de probabilidad normal para tener cierta idea de la desviación de la 
normalidad en un conjunto de datos. 

Para muestras pequeñas a menudo resulta difícil detectar desviaciones de una distri- 
bución normal. (Las pruebas de la bondad del ajuste se presentan en una sección poste- 
rior de este capítulo). Para distribuciones en forma de campana de las variables aleatorias 
X Xy- X,, es probable que el uso de la distribución f para pruebas o intervalos de con- 
fianza produzca resultados muy buenos. Cuando haya duda, el usuario debería recurrir a 
los procedimientos no paramétricos que se presentan en el capítulo 16. 
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Impresiones o salidas por computadora con comentarios para pruebas t 
de una sola muestra 


Seguramente al lector le interesará ver comentarios impresos por computadora que 
muestren el resultado de una prueba 7 con una sola muestra. Suponga que un ingeniero 
se interesa en probar el sesgo en un medidor de pH. Se reúnen datos de una sustancia 
neutra (pH = 7.0). Se toma una muestra de las mediciones y los datos son los siguientes: 


7.07 7.00 7.10 6.97 7.00 7.03 7.01 7.01 6.98 7.08 


Entonces, es de interés probar 
Ни = 7.0, 
H: u + 7.0. 


En este caso utilizamos el paquete de cómputo MINITAB para ilustrar el análisis del 
conjunto de datos anterior. Observe los componentes clave de la impresión o salida que 
se muestra en la figura 10.12. Desde luego, la media ӯ es 7.0250, StDev es simplemente 
la desviación estándar de la muestra s = 0.044 y SE Mean es el error estándar estimado 
de la media, y se calcula como s/ Уп = 0.0139. El valor 1 es el cociente 


(7.0250—7)/0.0139 = 1.80. 


pH-meter 
7.07 7.00 7.10 6.97 7.00 7203 7.01 7.01 6.98 7.08 
МТВ > Onet 'pH-meter'; SUBC> Теѕі7. 


One-Sample Т: pH-meter Test of ти = 7 vs not = 7 
Variable N Mean StDev SE Mean 95% CI T P 
pH-meter 10 7.02500 0.04403 0.01392 (6.99350,7.05650) 1.80 0.106 


Figura 10.12: Impresión de MINITAB para la prueba г de una muestra para el medidor de pH. 


El valor P de 0.106 sugiere resultados que no son concluyentes. No hay evidencia 
que sugiera un firme rechazo de H, (con base en una а de 0.05 o de 0.10), ni se puede 
concluir con certeza que el medidor de pH esté libre de sesgo. Observe que el tamaño 
de la muestra de 10 es muy pequeño. Un incremento en el tamaño de la muestra (quizás 
otro experimento) podría resolver las cosas. En la sección 10.6 aparece un análisis res- 
pecto al tamaño adecuado de la muestra. 


10.5 Dos muestras: pruebas sobre dos medias 


El lector deberá comprender la relación entre pruebas e intervalos de confianza y sólo 
puede confiar plenamente en los detalles que ofrece el material sobre el intervalo de con- 
fianza del capítulo 9. Las pruebas respecto a dos medias representan un conjunto de he- 
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rramientas analíticas muy importantes para el científico o el ingeniero. El procedimiento 
experimental es muy parecido al que se describe en la sección 9.8. Se extraen dos mues- 
tras aleatorias independientes de tamaños n, y n,, respectivamente, de dos poblaciones 
con medias 4, y и„у Varianzas с? y сз. Sabemos que la variable aleatoria 


z= (Ху — X2) — (ш — 2) 


yo; /n + 03/nm 


tiene una distribución normal estándar. Suponemos aquí que n, y n, son suficientemente 
grandes, por lo que se aplica el teorema del límite central. Por supuesto, si las dos po- 
blaciones son normales, el estadístico anterior tiene una distribución normal estándar 
incluso para n, y n, pequeñas. Evidentemente, si podemos suponer que O, = 0, = о, el 
estadístico anterior se reduce a 


(XX 2) – (ш — Шо) 


т\/1/пу +1/n2 


Los dos estadísticos anteriores sirven como base рага el desarrollo de los procedimientos 
de prueba que incluyen dos medias. La equivalencia entre las pruebas y los intervalos de 
confianza, junto con los detalles técnicos implicados en las pruebas sobre una media, 
permiten que la transición a pruebas con dos medias sea sencilla. 

La hipótesis bilateral sobre dos medias se escribe de manera muy general como 


Z 


Ho: Ш — Ш = do. 


Es evidente que la alternativa puede ser bilateral o unilateral. De nuevo, la distribu- 
ción que se utiliza es la distribución del estadístico de prueba bajo Н. Se calculan los 
valores х ух, y para с, y с, conocidas, el estadístico de prueba es dado por 


(X1 —X2) — do 


yor /т +02 /n2' 


con una región crítica de dos colas en el caso de una alternativa bilateral. Es decir, se 
rechaza Н, а favor de Н: 4, —u, £ dy, siz > Zan OZ < an Las regiones críticas de una 
cola se utilizan en el caso de alternativas unilaterales. El lector debería estudiar, como 
antes, el estadístico de prueba y estar satisfecho de que para, digamos Н: u, — 4, > dy 
la señal que favorece H, provenga de valores grandes de z. Por consiguiente, se aplica la 


región crítica de la cola superior. 


Varianzas desconocidas pero iguales 


Las situaciones más comunes que implican pruebas sobre dos medias son aquellas con 
varianzas desconocidas. Si el científico interesado está dispuesto a suponer que ambas 
distribuciones son normales y que с = O, = о, se puede utilizar la prueba t agrupada 
(a menudo llamada prueba £ de dos muestras). El estadístico de prueba (véase la sección 
9.8) es dado por el siguiente procedimiento de prueba. 
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Prueba £ Para la hipótesis bilateral 


agrupada de 
dos muestras 


Нун, = Hz 
Нин, F А, 


rechazamos H, al nivel de significancia о cuando el estadístico £ calculado 


(xı —X2) — do 


5р 1/п + 1/n2 


donde 


SD 4D) 


5 ni +n —2 


excede a Ѓа/2, nı +n2—2 0 es menor que — Ѓа/2, пу +n3-2-. 


Recuerde que en el capítulo 9 se explicó que los grados de libertad para la distribución tson 
un resultado del agrupamiento de la información de las dos muestras para estimar o°. Las 
alternativas unilaterales, como era de esperarse, sugieren regiones críticas unilaterales. Por 
ejemplo, para Ну: ш — M2 > dy, rechace Ну: ш — Шо = dy cuando t > fan +n>-2: 


Ejemplo 10.6: | Se llevó a cabo un experimento para comparar el desgaste por abrasivos de dos diferen- 


Solución: 


tes materiales laminados. Se probaron 12 piezas del material 1 exponiendo cada pieza a 
una máquina para medir el desgaste. Se probaron 10 piezas del material 2 de manera 
similar. En cada caso se observó la profundidad del desgaste. Las muestras del material 
1 revelaron un desgaste promedio (codificado) de 85 unidades con una desviación están- 
dar muestral de 4; en tanto que las muestras del material 2 revelaron un promedio de 81 
y una desviación estándar muestral de 5. ¿Podríamos concluir, a un nivel de significancia 
de 0.05, que el desgaste abrasivo del material 1 excede al del material 2 en más de 2 
unidades? Suponga que las poblaciones son aproximadamente normales con varianzas 
iguales. 

Representemos соп и, у и, las medias de la población del desgaste abrasivo para el ma- 
terial 1 y el material 2, respectivamente. 


1. Нш -и, = 2. 
2. Н:ш-и, > 2. 
3. а = 0.05. 


(51—22) 40 


4. Región crítica: г > 1.725, donde t = 
Sp м/т +1 /п2 


соп у = 20 grados de libertad. 


5. Cálculos: 
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En consecuencia, 


о (11)(16) + (9)(25) 
Р 12+ 10-2 
(85 — 81) — 2 


t = = 
4.478,/1/12 + 1/10 


Р =Р(Т > 1.04) = 0.16 (Véase la tabla A.4). 


= 4.478, 


1.04, 


6. Decisión: no rechazar Н. No podemos concluir que el desgaste abrasivo del mate- 
rial 1 excede al del material 2 en más de 2 unidades. JJ 


Varianzas desconocidas pero diferentes 


Hay situaciones donde al analista no le es posible suponer que с, = с,. De la sección 9.8 
recuerde que, si las poblaciones son normales, el estadístico 


_ (X1 —X2)-do 
№52 /пу +83/n2 


tiene una distribución Т aproximada con grados de libertad aproximados 


Т! 


v= (52 /пі + 52 /по)? 
(s/n (пу — 1) +(53/n2)2/(n2 = 1) 


Como resultado, el procedimiento de prueba consiste en no rechazar Н, cuando 
/ 
Ha/2,v <t < taz > 


con у dado como antes. De nuevo, como en el caso de la prueba ѓ agrupada, las alterna- 
tivas unilaterales sugieren regiones críticas unilaterales. 


Observaciones pareadas 


Un estudio de la prueba f de dos muestras o el intervalo de confianza sobre la diferencia 
entre medias deberían sugerir la necesidad de un diseño experimental. Recuerde el análi- 
sis de las unidades experimentales en el capítulo 9, donde se sugirió que las condiciones 
de las dos poblaciones (a menudo denominadas como los dos tratamientos) se deberían 
asignar de manera aleatoria a las unidades experimentales. Esto se realiza para evitar 
resultados sesgados debido a las diferencias sistemáticas entre unidades experimentales. 
En otras palabras, en términos de la jerga para la prueba de hipótesis, es importante 
que la diferencia significativa que se encuentre entre las medias se deba a las diferentes 
condiciones de las poblaciones y no a las unidades experimentales en el estudio. Por 
ejemplo, considere el ejercicio 9.40 de la sección 9.9. Los 20 tallos desempeñan el pa- 
pel de unidades experimentales. Diez de ellos se tratan con nitrógeno y 10 se dejan sin 
tratamiento. Es muy importante que esta asignación a los tratamientos “con nitrógeno” 
y “sin nitrógeno” sea aleatoria para garantizar que las diferencias sistemáticas entre los 
tallos no interfieran con una comparación válida entre las medias. 

En el ejemplo 10.6 el momento de la medición es la opción más probable de la 
unidad experimental. Las 22 piezas de material se deberían medir en orden aleatorio. 
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Necesitamos protegernos contra la posibilidad de que las mediciones del desgaste que 
se realicen casi al mismo tiempo tiendan a dar resultados similares. No se esperan dife- 
rencias sistemáticas (no aleatorias) en las unidades experimentales. Sin embargo, las 
asignaciones aleatorias protegen contra el problema. 

Las referencias a la planeación de experimentos, aleatorización, elección del ta- 
maño de la muestra, etcétera, continuarán influyendo en gran parte del desarrollo en los 
capítulos 13, 14 y 15. Cualquier científico o ingeniero cuyo interés resida en el análisis 
de datos reales debería estudiar este material. La prueba ѓ agrupada se amplía en el capí- 
tulo 13 para cubrir más de dos medias. 

La prueba de dos medias se puede llevar a cabo cuando los datos están en forma de 
observaciones pareadas, como se estudió en el capítulo 9. En esta estructura de pareado 
las condiciones de las dos poblaciones (tratamientos) se asignan de forma aleatoria den- 
tro de unidades homogéneas. El cálculo del intervalo de confianza рага и, — u, en la 
situación con observaciones pareadas se basa en la variable aleatoria 


Pto 


а. 


Т 


donde D y S, son variables aleatorias que representan la media muestral y la desviación 
estándar de las diferencias de las observaciones en las unidades experimentales. Como 
en el caso de la prueba t agrupada, la suposición es que las observaciones de cada pobla- 
ción son normales. Este problema de dos muestras se reduce en esencia a un problema 
de una muestra utilizando las diferencias calculadas d,, d,,..., 4. Por consiguiente, la 
hipótesis se reduce a 


Ho: Hp = do. 
El estadístico de prueba calculado es dado entonces por 


_ d-d 


S sala 


Las regiones críticas se construyen usando la distribución t con n — 1 grados de libertad. 


t 


El problema de la interacción en una prueba £ pareada 


El siguiente estudio de caso no sólo ilustra el uso de la prueba f pareada, sino que el 
análisis revelará mucho sobre las dificultades que surgen cuando ocurre una interacción 
entre los tratamientos y las unidades experimentales en la estructura de la t pareada. 
Recuerde que la interacción entre factores se presentó en la sección 1.7, en un análisis 
de los tipos generales de estudios estadísticos. El concepto de interacción será un tema 
importante desde el capítulo 13 hasta el 15. 

Existen ciertos tipos de pruebas estadísticas en los que la existencia de una inte- 
racción produce dificultades. Un ejemplo es la prueba £ pareada. En la sección 9.9 se 
utilizó la estructura pareada en el cálculo de un intervalo de confianza sobre la diferencia 
entre dos medias, y se reveló la ventaja del pareado para situaciones en que las unidades 
experimentales son homogéneas. El pareado produce una reducción en с,, la desvia- 
ción estándar de una diferencia D, = Х,, – Х,, como se explicó en la sección 9.9. Si hay 
una interacción entre los tratamientos y las unidades experimentales, la ventaja lograda 
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mediante el pareado se podría reducir de manera sustancial. Por consiguiente, en el 
ejemplo 9.13 de la página 293 la suposición de la ausencia de interacción permitió que la 
diferencia en los niveles medios de TCDD (plasma contra tejido adiposo) fuera la misma 
en todos los veteranos. Un vistazo rápido a los datos sugiere que no hay una violación 
significativa de los supuestos de ausencia de interacción. 

Para demostrar cómo influye la interacción en Var(D) y, por lo tanto, en la cali- 
dad de la prueba t pareada, es aleccionador revisar la i-ésima diferencia dada рог D, = 
X,—X,, = (щ-и,) + (€, — €,), donde Ху Х„ se toman de la ¡-ésima unidad experimen- 
tal. Si la unidad pareada es homogénea, los errores en X, y en X, serán similares y no 
independientes. En el capítulo 9 señalamos que la covarianza positiva entre los errores 
da como resultado una Var(D) reducida. Por consiguiente, el tamaño de la diferencia en 
los tratamientos y la relación entre los errores en Ху Х,, a los que contribuye la unidad 
experimental, tenderán a permitir la detección de una diferencia significativa. 


¿Qué condiciones resultan en una interacción? 


Consideremos una situación en la que las unidades experimentales no son homogéneas. 
Más bien, considere la ¡-ésima unidad experimental con las variables aleatorias Ху X, 
que no son similares. Sean €,, y €, variables aleatorias que representan los errores en los 
valores Ху X,» respectivamente, en la unidad ¡-ésima. Así, podemos escribir 


Xii =H +€ y Хә» = Ma +06. 


Los errores con valor esperado cero podrían tender a provocar que los valores de 
respuesta X, y Х„ se muevan en direcciones opuestas, dando como resultado un valor 
negativo para Cov(€,,, €,,) y, por ende, un valor negativo para Cov(X,, X, ). En realidad, 
el modelo se podría volver aún más complicado por el hecho de que от = Маг(є) £ 
оз = Var(e,,). Los parámetros de la varianza y Іа covarianza podrían variar entre las п 
unidades experimentales. Así, a diferencia del caso con homogeneidad, D, tenderá a ser 
muy diferente en todas las unidades experimentales debido a la naturaleza heterogénea 
de la diferencia en €, — €, entre las unidades. Esto produce la interacción entre los tra- 
tamientos y las unidades. Además, para una unidad experimental específica (véase el 
teorema 4.9), 


сі = Var(D) =Var(e1) + Var(e2) — 2 Cov(er, єз) 


está inflado por el término negativo de covarianza, de manera que la ventaja lograda por 
el pareado en el caso de la unidad homogénea se pierde en el caso que aquí se describe. 
En tanto que la inflación en Var(D) variará de un caso a otro, en algunas situaciones 
existe el peligro de que el aumento en la varianza neutralice cualquier diferencia que 
exista entre и, y 1, Desde luego, un valor grande de d en el estadístico t podría reflejar 
una diferencia en el tratamiento que compense el estimado inflado de la varianza у. 


Estudio de caso 10.1: | Datos de muestra de sangre: En un estudio realizado en el Departamento de Silvicul- 
tura y Fauna de Virginia Tech, J. A. Wesson examinó la influencia del fármaco succinyl- 
choline sobre los niveles de circulación de andrógenos en la sangre. Se obtuvieron mues- 
tras de sangre de venados salvajes inmediatamente después de recibir una inyección 
intramuscular de succinylcholine con dardos de un rifle de caza. Treinta minutos después 
se obtuvo una segunda muestra de sangre y después los venados fueron liberados. Los 
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niveles de andrógenos de 15 venados al momento de la captura y 30 minutos más tarde, 
medidos en nanogramos por mililitro (ng/mL), se presentan en la tabla 10.2. 


Suponga que las poblaciones de niveles de andrógenos al momento de la inyección 


y 30 minutos después se distribuyen normalmente, y pruebe, a un nivel de significancia 
de 0.05, si las concentraciones de andrógenos se alteraron después de 30 minutos. 


Tabla 10.2: Datos para el estudio de caso 10.1 


Andrógenos (ng/mL) 

Venado Al momento de la inyección 30 minutos después de la inyección d; 
1 2.76 7.02 4.26 
2 5.18 3.10 —2.08 
3 2.68 5.44 2.76 
4 3.05 3.99 0.94 
5 4.10 3:21 1.11 
6 7.05 10.26 3.21 
7 6.60 13.91 7.31 
8 4.79 18.53 13.74 
9 7.39 7.91 0.52 

10 7.30 4.85 —2.45 
11 11.78 11.10 —0.68 
12 3.90 3.74 —0.16 
13 26.00 94.03 68.03 
14 67.48 94.03 26.55 
15 17.04 41.70 24.66 


Solución: Sean u, y u, la concentración promedio de andrógenos al momento de la inyección y 
30 minutos después, respectivamente. Procedemos como sigue: 


1. Неш = и, ону = щ-и, = 0. 
2. H: u, F и, ои = 1,1, FO. 
3. 
4 


о = 0.05. 
d—do 


. Región crítica: t < –2.145 y t > 2.145, donde t = Ah con v = 14 grados de 
SD n 


libertad. 


. Cálculos: La media muestral y la desviación estándar para las d, son 


d = 9.848 y s, = 18.474. 
Por lo tanto, 


Кз 9.848 — 0 2.06. 


T 18.474/Y15 | 


. Aunque el estadístico г no es significativo al nivel 0.05, de la tabla A.4, 


P =P(|T| > 2.06) = 0.06. 


Como resultado, existe cierta evidencia de que hay una diferencia en los niveles 
medios circulantes de andrógenos. 
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La suposición de la ausencia de interacción implicaría que el efecto sobre los nive- 
les de andrógenos de los venados es casi el mismo en los datos de ambos tratamientos, 
es decir, en el momento de la inyección de succinylcholine y 30 minutos después. Esto 
se puede expresar cambiando los papeles de los dos factores; por ejemplo, la diferencia 
en los tratamientos es casi igual en todas las unidades, es decir, los venados. Ciertamente 
hay algunas combinaciones venado/tratamiento para las que parece ser válida la supo- 
sición de ausencia de interacción, pero difícilmente existen evidencias firmes de que las 
unidades experimentales sean homogéneas. Sin embargo, la naturaleza de la interacción 
y el incremento resultante en Var(D) parecen estar dominados por una diferencia sus- 
tancial en los tratamientos. Esto también es demostrado por el hecho de que 11 de los 
15 venados mostraron señales positivas para las d, calculadas y las d, negativas (para los 
venados 2, 10, 11 y 12) son pequeñas en magnitud comparadas con las 12 positivas. Por 
consiguiente, al parecer el nivel medio de andrógenos es significativamente más alto 30 
minutos después de la inyección que en el momento en que se aplica, y las conclusiones 
podrían ser más firmes de lo que sugiere p = 0.06. 


Impresiones por computadora con comentarios para pruebas í pareadas 


La figura 10.13 presenta una impresión por computadora del SAS para una prueba  pa- 
reada usando los datos del estudio de caso 10.1. Observe que el listado se parece al de 
una prueba г de una sola muestra y, por supuesto, esto es con exactitud lo que se realizó, 
ya que la prueba busca determinar si d es significativamente diferente de cero. 


Analysis Variable : Diff 


N Mean Std Error t Value Рг > |t| 


Figura 10.13: Impresión por computadora del SAS de la prueba t pareada para 
los datos del estudio de caso 10.1. 


Resumen de los procedimientos de prueba 


Mientras completamos el desarrollo formal de pruebas sobre medias de la población, 
ofrecemos la tabla 10.3, que resume el procedimiento de prueba para los casos de una 
sola media y de dos medias. Observe el procedimiento aproximado cuando las distri- 
buciones son normales y las varianzas se desconocen pero no se suponen iguales. Este 
estadístico se estudió en el capítulo 9. 
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En la sección 10.2 demostramos cómo el analista puede explotar las relaciones entre el 
tamaño de la muestra, el nivel de significancia о y la potencia de la prueba para alcanzar 
cierto estándar de calidad. En la mayoría de las circunstancias prácticas el experimento 
debería planearse y, de ser posible, elegir el tamaño de la muestra antes del proceso de 
recolección de datos. Por lo general el tamaño de la muestra se determina de modo que 


350 Capítulo 10 Pruebas de hipótesis de una y dos muestras 


Tabla 10.3: Pruebas relacionadas con medias 


Ho Valor del estadístico de prueba Н! Región crítica 
7 = Ho H< Шо 2 < — 20 
Ш = Ho = aha" с conocida к> o © > а 
и + Ho &<— Zaj2 O Z > ајд 
i Кш. б=й=], p< Ho t< — fa 
L = o s/y/n и> Шо t> la 
с desconocida HL F Шо t < —ta/2 O t> laj2 
_ © -%)-%_. ш = 0 < do Z<—Za 
Ш = Ш = do Von +02/n>' Шш = a > dy Z> Za 
о у 0 conocidas ш = о Fdo Z < — Zaj2 0 Z> Za/2 
q. (р -%2)-d0 | 
sp y 1/m pe А = <d  t<-ta 
Ha = Ha = do = йе „ш л. а 
ч = d t<-t, t> 1 
„бя 1аф (аа) ATRAS е 
sé = 
Е пі +n —2 
pa (х1 —X2) – 40. 
ysi/m +s3/n2, ш — a < do t <ta 
Hı — № = do = (s7/m +83/n2) ш) — pa > do t > de 
im? y орта) Шш —ш #4 t<- taj 0 t > taj 
о + о y desconocidas 
Hp = 4 ¿= Id, Hp < do ї< = la 
observaciones Е sa fyn Hp > 4 t>lta 
pareadas у=п—1 Hp Fdo t< — taj2 O t> la)? 


permita lograr una buena potencia para una о fija y una alternativa específica fija. Esta 
alternativa fija puede estar en la forma de и — u en el caso de una hipótesis que incluya 
una sola media o и, — џи, en el caso de un problema que implique dos medias. Los casos 
específicos serán ilustrativos. 

Suponga que deseamos probar la hipótesis 


Нш = hy 
H =4 > и, 
con un nivel de significancia о, cuando se conoce la varianza o°. Para una alternativa 


específica, digamos, и = и, + д, en la figura 10.14 se muestra que la potencia de nues- 
tra prueba es 


1-fB=P(X >a cuando и = ро +Ò. 


Por lo tanto, 


В = Р(Х < a cuando H = ho + Ô 
X — (po +0) < A (lo + 0) 
ofyn o/y/n 


=P cuando u = Ho + ô|. 
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Ho a o+ô ^ 


Figura 10.14: Prueba de u = и, contra u = и, + д. 


Bajo la hipótesis alternativa и = и, + д, el estadístico 


X — (po +0) 
g/yn 
es la variable normal estándar Z. Por lo tanto, 


a — Ho ô 


a=r (z< тт) Р (< 377): 


de donde concluimos que 


y, en consecuencia, 


(Za +28) 0? 
52 | 
un resultado que también es verdadero cuando la hipótesis alternativa es и < и. 
En el caso de una prueba de dos colas obtenemos la potencia 1 — 8 para una alter- 
nativa específica cuando 


Elección del tamaño de la muestra: n = 


_ Gaya +28) 07 
n= ERE 


Ejemplo 10.7: | Suponga que deseamos probar la hipótesis 
Н; и = 68 kilogramos, 
H: и > 68 kilogramos, 


para los pesos de estudiantes hombres en cierta universidad usando un nivel de signifi- 
cancia œ = 0.05 cuando se sabe que с = 5. Calcule el tamaño muestral que se requiere 
si la potencia de nuestra prueba debe ser 0.95 cuando la media real es 69 kilogramos. 
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Solución: Como а = В = 0.05, tenemos =, = g= 1.645. Para la alternativa 8 = 69 tomamos ô = 


І y entonces, 


кы (1.645 + 1.645)2(25) 


= 270.6. 
1 0.6 


Por lo tanto, se requieren 271 observaciones si la prueba debe rechazar la hipótesis nula 
el 95% de las veces cuando, de hecho, u es tan grande como 69 kilogramos. JJ 


El caso de dos muestras 


Se puede utilizar un procedimiento similar para determinar el tamaño de la muestra n = 
п, = n, que se requiere para una potencia específica de la prueba en que se comparan dos 
medias de la población. Por ejemplo, suponga que deseamos probar la hipótesis 


Нуш „= dy 
H: 4, = #4, 


cuando se conocen с, y с,. Para una alternativa específica, digamos и-и, = d, + Ô, en 
la figura 10.15 se muestra que la potencia de nuestra prueba es 


1-8 =P (|Xı – Х| > a cuando ш — р = do + ô). 


aļ2 А В [2 
-å do a do+ ô 


X 
Figura 10.15: Prueba de и, — и, = d, contra u, — и, = d, + б. 


Por lo tanto, E _ 
B = Р(—а < Ху —X <a cuando ш — la = do + д) 


SB —a- (do +ô) _ (Xı -X2 ) — (do + ô) 
y (0; +03)/n (0? +05) /п 
с a — (dy + 5) 


(o? +03)/n 


Con la hipótesis alternativa 4, –и, = d, + ô, el estadístico 


cuando Шш — la = do + Ô|. 


X 1 —X2 — (do +ð 
(04 + о2) /п 
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es la variable normal estándar Z. Ahora bien, al escribir 
= = do а= do 


== ===. Y "91" ===> 
(02 + о2)/п (0? + сз) /п 


tenemos 
ô ô 


—Za/2 «ур < аә = —==—— |, 
Ки y (0? + 03) /п о? y (01 + 05) /п 


de donde concluimos que 


p=P 


$ 
—.{8 = 4 а) 
В а а жо) п 
y, por lo tanto, 
Сог +28) (01 + 03) 
n= 82 И 


Рага la prueba de una sola cola, la expresión рага el tamaño requerido de la muestra 
cuando п = п, = n, es 


25? 2 
(Za +28) (01 + 05) 
52 | 
Cuando se desconoce la varianza de la población (o varianzas еп la situación de dos 


muestras), la elección del tamaño de la muestra no es directa. Al probar la hipótesis и = 
1 cuando el valor verdadero es u = д, + Ô, el estadístico 


Elección del tamaño de la muestra: n = 


X — (р +ô) 
ГТ ж 


no sigue la distribución t, como se podría esperar, más bien sigue la distribución £ no 
central. Sin embargo, existen tablas o gráficas que se basan en la distribución г no cen- 
tral para determinar el tamaño adecuado de la muestra, si se dispone de algún estimado 
de т о si дев un múltiplo de ø. La tabla A.8 proporciona los tamaños muestrales nece- 
sarios para controlar los valores de y 3 para diversos valores de 


A ОИ ЕВ 
с с 


en el caso de pruebas de una y de dos colas. En el caso de Іа prueba г de dos muestras en la 
que se desconocen las varianzas pero se suponen iguales, obtenemos los tamaños mues- 
trales n = п, = n, necesarios para controlar los valores de о y 8 para diversos valores de 


a = À _ ln =e — dol 
од од 


de la tabla A.9. 


Ejemplo 10.8: ГАІ comparar el comportamiento de dos catalizadores sobre el efecto del producto de una 
reacción se realiza una prueba £ de dos muestras con œ = 0.05. Se considera que las 
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varianzas de los productos son iguales para los dos catalizadores. ¿De qué tamaño debe 
ser una muestra para cada catalizador si se desea probar la hipótesis 


Ay My = Ha 
H: u Fu, 


si es esencial detectar una diferencia de 0.80 entre los catalizadores con 0.9 de probabi- 
lidad? 


De la tabla A.9, con а = 0.05 para una prueba de dos colas, 8 = 0.1 y 
А = [8:89] = 0.8, 
с Jl 


encontramos que el tamaño requerido de la muestra es n = 34, 

En situaciones prácticas sería difícil forzar a un científico o a un ingeniero a hacer un 
compromiso sobre la información a partir de la cual se puede encontrar un valor de А. Se 
recuerda al lector que el valor А cuantifica el tipo de diferencia entre las medias que el cien- 
tífico considera importantes; es decir, una diferencia que se considere significativa desde 
un punto de vista científico, no estadístico. El ejemplo 10.8 ilustra cómo suele hacerse esta 
elección, a saber, mediante la selección de una fracción de с. Evidentemente, 51 el tamaño 
de la muestra se basa en una elección de | Ól, que es una fracción pequeña de с, el tamaño 
muestral que resulta podría ser muy grande comparado con lo que permite el estudio. 


10.7 Métodos gráficos para comparar medias 


En el capítulo 1 se puso mucha atención a la presentación de datos en forma gráfica, 
como los diagramas de tallo y hojas y las gráficas de caja y bigote. En la sección 8.8 las 
gráficas de cuantiles y las gráficas normales cuantil-cuantil se utilizaron para brindar 
una “imagen” y resumir así un conjunto de datos experimentales. Muchos paquetes de 
cómputo producen representaciones gráficas. A medida que procedamos con otras for- 
mas de análisis de datos, por ejemplo, el análisis de regresión y el análisis de varianza, 
los métodos gráficos se vuelven aún más informativos. 

Los auxiliares gráficos no se pueden utilizar como un reemplazo del propio procedi- 
miento de prueba. En realidad, el valor del estadístico de prueba indica el tipo adecuado de 
evidencia en apoyo de H, o H. Sin embargo, una imagen ofrece una buena ilustración y a 
menudo es un mejor comunicador de evidencia para el beneficiario del análisis. Además, 
una imagen con frecuencia dejará claro por qué se encontró una diferencia significativa. 
La falla de una suposición importante se puede expresar mediante un resumen gráfico. 

Para la comparación de medias, las gráficas de caja y bigote simultáneas propor- 
cionan una imagen clara. El lector debería recordar que estas gráficas muestran el per- 
centil 25, el percentil 75 y la mediana en un conjunto de datos. Además, las extensiones 
muestran los extremos en un conjunto de datos. Considere el ejercicio 10.40 al final de 
esta sección. Se midieron los niveles en plasma de ácido ascórbico en dos grupos de mu- 
jeres embarazadas: fumadoras y no fumadoras. En la figura 10.16 se observan las gráficas 
de caja y bigote para ambos grupos de mujeres y dos cosas son muy evidentes; al tomar 
en cuenta la variabilidad parece haber una diferencia despreciable en las medias muestra- 
les. Además, parece que la variabilidad en los dos grupos es hasta cierto punto diferente. 
Desde luego, el analista debe tener en la mente las más bien considerables diferencias 
entre los tamaños muestrales en este caso. 
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Figura 10.16: Dos gráficas de caja y bigote con los Figura 10.17: Dos gráficas de caja y bigote para los 
datos de ácido ascórbico para mujeres fumadoras y datos de los tallos. 
no fumadoras. 


Considere el ejercicio 9.40 de la sección 9.9. En la figura 10.17 se presenta la gráfica 
múltiple de caja y bigote para los datos de 10 tallos, de los cuales sólo la mitad recibió el 
tratamiento con nitrógeno. Tal gráfica revela una variabilidad menor para el grupo que no 
recibió nitrógeno. Además, la falta de traslape de las cajas sugiere una diferencia signifi- 
cativa entre los pesos medios de los tallos para los dos grupos. Parecería que la presencia 
de nitrógeno aumenta el peso de los tallos y quizás aumente la variabilidad en los pesos. 

No existen reglas generales relacionadas con el momento cuando dos gráficas de caja 
y bigote brindan evidencia de diferencias significativas entre las medias. Sin embargo, 
una pauta aproximada es que si la línea del percentil 25 para una muestra excede a la línea 
de la mediana de la otra muestra, hay evidencia sólida de una diferencia entre las medias. 

Se hará más énfasis en los métodos gráficos en un estudio de caso de la vida real que 
se presenta más adelante en este capítulo. 


Impresiones por computadora con comentarios para pruebas t 
con dos muestras 


Considere nuevamente el ejercicio 9.40 de la página 294, donde se reunieron datos de 
tallos que recibieron y no recibieron nitrógeno. Pruebe 


A; ША = Uno 
H: рут > Uno» 


donde las medias de la población indican los pesos medios. La figura 10.18 es una im- 
presión por computadora con comentarios generados con el programa SAS. Observe que 
se presentan la desviación estándar y el error estándar muestrales para ambas muestras. 
También se incluye el estadístico т bajo la suposición de varianzas iguales y varianzas 
diferentes. En la gráfica de caja y bigote que se observa en la figura 10.17 en realidad 
parece que se transgrede la suposición de igualdad de varianzas. Un valor P de 0.0229 
sugiere una conclusión de medias diferentes. Esto coincide con la información de diag- 
nóstico que se presenta en la figura 10.18. A propósito, observe que гу £’ son iguales en 
este caso, ya que n, = п,. 
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TTEST Procedure 
Variable Weight 
Mineral N Mean Std Dev Std Err 
No nitrogen 10 0.3990 0.0728 0.0230 
Nitrogen 10 0.5650 0.1867 0.0591 
Variances DF t Value Pr > |+ | 
Equal 18 2.62 0.0174 
Unequal LL.7 2.62 0.0229 


Test the Equality of Variances 


Variable Num DF 
Weight 9 


Den DF 


F Value 
9 6.58 


Pr > F 
0.0098 


Figura 10.18: Impresión del SAS para la prueba г de dos muestras. 


Ejercicios 


10.19 En un informe de investigación, Richard H. 
Weindruch, de la Escuela de Medicina de la UCLA, 
afirma que los ratones con una vida promedio de 32 
meses vivirán hasta alrededor de 40 meses si 40% de 
las calorías en su dieta se reemplazan con vitaminas y 
proteínas. ¿Hay alguna razón para creer que u < 40, 
si 64 ratones que son sometidos a esa dieta tienen una 
vida promedio de 38 meses, con una desviación están- 
dar de 5.8 meses? Utilice un valor P en su conclusión. 


10.20 Una muestra aleatoria de 64 bolsas de palomitas 
con queso chedar pesan, en promedio, 5.23 onzas, con 
una desviación estándar de 0.24 onzas. Pruebe la hipó- 
tesis de que и = 5.5 onzas contra la hipótesis alternativa 
de que u < 5.5 onzas, al nivel de significancia de 0.05. 


10.21 Una empresa de material eléctrico fabrica 
bombillas que tienen una duración que se distribuye de 
forma aproximadamente normal con una media de 800 
horas y una desviación estándar de 40 horas. Pruebe 
la hipótesis de que и = 800 horas contra la alternativa 
de que и + 800 horas, si una muestra aleatoria de 30 
bombillas tiene una duración promedio de 788 horas. 
Utilice un valor P en su respuesta. 


10.22 En la revista Hypertension de la American 
Heart Association, investigadores reportan que los indi- 
viduos que practican la meditación trascendental (MT) 
bajan su presión sanguínea de forma significativa. Si 
una muestra aleatoria de 225 hombres que practican la 
MT meditan 8.5 horas a la semana, con una desviación 
estándar de 2.25 horas, ¿esto sugiere que, en promedio, 
los hombres que utilizan la MT meditan más de 8 horas 
por semana? Cite un valor P en su conclusión. 


10.23 Pruebe la hipótesis de que el contenido prome- 
dio de los envases de un lubricante específico es de 10 
litros, si los contenidos de una muestra aleatoria de 10 
envases son: 10.2, 9.7, 10.1, 10.3, 10.1, 9.8, 9.9, 10.4, 
10.3 y 9.8 litros. Utilice un nivel de significancia de 0.01 


y suponga que la distribución del contenido es normal. 


10.24 La estatura promedio de mujeres en el grupo 
de primer año de cierta universidad ha sido, histórica- 
mente, de 162.5 centímetros, con una desviación están- 
dar de 6.9 centímetros. ¿Existe alguna razón para creer 
que ha habido un cambio en la estatura promedio, si 
una muestra aleatoria de 50 mujeres del grupo actual de 
primer año tiene una estatura promedio de 165.2 centí- 
metros? Utilice un valor P en su conclusión. Suponga 
que la desviación estándar permanece constante. 


10.25 Se afirma que los automóviles recorren en 
promedio más de 20,000 kilómetros por año. Para pro- 
bar tal afirmación se pide a una muestra de 100 propie- 
tarios de automóviles seleccionada de manera aleatoria 
que lleven un registro de los kilómetros que recorren. 
¿Estaría usted de acuerdo con esta afirmación, si la 
muestra aleatoria indicara un promedio de 23,500 kiló- 
metros y una desviación estándar de 3900 kilómetros? 
Utilice un valor P en su conclusión. 


10.26 De acuerdo con un estudio sobre un régimen 
alimenticio, la ingesta elevada de sodio se relaciona con 
úlceras, cáncer estomacal y migrañas. El requerimiento 
humano de sal es de tan sólo 220 miligramos diarios, 
el cual se rebasa en la mayoría de las porciones indivi- 
duales de cereales listos para comerse. Si una muestra 
aleatoria de 20 porciones similares de cierto cereal tiene 
un contenido medio de 244 miligramos de sodio y una 
desviación estándar de 24.5 miligramos, ¿esto sugiere, 
a un nivel de significancia de 0.05, que el contenido 
promedio de sodio para porciones individuales de ese 
cereal es mayor que 220 miligramos? Suponga que la 
distribución de contenidos de sodio es normal. 


10.27 Un estudio de la Universidad de Colorado en 
Boulder revela que correr aumenta el porcentaje de la 
tasa metabólica basal (TMB) en mujeres ancianas. La 
TMB promedio de 30 ancianas corredoras fue 34.0% 
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más alta que la TMB promedio de 30 ancianas sedenta- 
rias, en tanto que las desviaciones estándar reportadas 
fueron de 10.5 y 10.2%, respectivamente. ¿Existe un 
aumento significativo en la TMB de las corredoras res- 
pecto a las sedentarias? Suponga que las poblaciones se 
distribuyen de forma aproximadamente normal con va- 
rianzas iguales. Utilice un valor P en sus conclusiones. 


10.28 De acuerdo con Chemical Engineering, una pro- 
piedad importante de la fibra es su absorbencia de agua. 
Se encontró que el porcentaje promedio de absorción 
de 25 pedazos de fibra de algodón seleccionados al azar 
es 20, con una desviación estándar de 1.5. Una muestra 
aleatoria de 25 pedazos de acetato reveló un porcentaje 
promedio de 12 con una desviación estándar de 1.25. 
¿Existe evidencia sólida de que el porcentaje promedio 
de absorción de la población es significativamente ma- 
yor para la fibra de algodón que para el acetato? Suponga 
que el porcentaje de absorbencia se distribuye de forma 
casi normal y que las varianzas de la población en el por- 
centaje de absorbencia para las dos fibras son iguales. 
Utilice un nivel de significancia de 0.05. 


10.29 La experiencia indica que el tiempo que re- 
quieren los estudiantes de último año de preparatoria 
para contestar una prueba estandarizada es una variable 
aleatoria normal con una media de 35 minutos. Si a una 
muestra aleatoria de 20 estudiantes de último año de 
preparatoria le toma un promedio de 33.1 minutos con- 
testar esa prueba con una desviación estándar de 4.3 
minutos, pruebe la hipótesis de que, a un nivel de signi- 
ficancia de 0.05, и = 35 minutos, contra la alternativa 
de que и < 33 minutos. 


10.30 Una muestra aleatoria de tamaño n, = 25, to- 
mada de una población normal con una desviación es- 
tándar O, = 5.2, tiene una media х, = 81. Una segunda 
muestra aleatoria de tamaño n, = 36, que se toma de 
una población normal diferente con una desviación es- 
tándar о, = 3.4, tiene una media х, = 76. Pruebe la 
hipótesis de que u, = u, contra la alternativa и # 4, 
Cite un valor P en su conclusión. 


10.31 Un fabricante afirma que la resistencia prome- 
dio a la tensión del hilo A excede a la resistencia a la 
tensión promedio del hilo B en al menos 12 kilogra- 
mos. Para probar esta afirmación se pusieron a prueba 
50 pedazos de cada tipo de hilo en condiciones simi- 
lares. El hilo tipo A tuvo una resistencia promedio a la 
tensión de 86.7 kilogramos con una desviación están- 
dar de 6.28 kilogramos; mientras que el hilo tipo B tuvo 
una resistencia promedio a la tensión de 77.8 kilogra- 
mos con una desviación estándar de 5.61 kilogramos. 
Pruebe la afirmación del fabricante usando un nivel de 
significancia de 0.05. 


10.32 El Amstat News (diciembre de 2004) lista los 
sueldos medios de profesores asociados de estadística 
en instituciones de investigación, en escuelas de huma- 
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nidades y en otras instituciones en Estados Unidos. 
Suponga que una muestra de 200 profesores asociados 
de instituciones de investigación tiene un sueldo pro- 
medio de $70,750 anuales con una desviación estándar 
de $6000. Suponga también que una muestra de 200 
profesores asociados de otros tipos de instituciones tie- 
nen un sueldo promedio de $65,200 con una desviación 
estándar de $5000. Pruebe la hipótesis de que el sueldo 
medio de profesores asociados de instituciones de in- 
vestigación es $2000 más alto que el de los profesores 
de otras instituciones. Utilice un nivel de significancia 
de 0.01. 


10.33 Se llevó a cabo un estudio para saber si el au- 
mento en la concentración de sustrato tiene un efecto 
apreciable sobre la velocidad de una reacción química. 
Con una concentración de sustrato de 1.5 moles por 
litro, la reacción se realizó 15 veces, con una veloci- 
dad promedio de 7.5 micromoles por 30 minutos y una 
desviación estándar de 1.5. Con una concentración de 
sustrato de 2.0 moles por litro, se realizaron 12 reac- 
ciones que produjeron una velocidad promedio de 8.8 
micromoles por 30 minutos y una desviación estándar 
muestral de 1.2. ¿Hay alguna razón para creer que este 
incremento en la concentración de sustrato ocasiona un 
aumento en la velocidad media de la reacción de más 
de 0.5 micromoles por 30 minutos? Utilice un nivel de 
significancia de 0.01 y suponga que las poblaciones se 
distribuyen de forma aproximadamente normal con va- 
rianzas iguales. 


10.34 Se realizó un estudio para determinar si los te- 
mas de un curso de física se comprenden mejor cuando 
éste incluye prácticas de laboratorio. Se seleccionaron 
estudiantes al azar para que participaran en un curso de 
tres semestres con una hora de clase sin prácticas 
de laboratorio o en un curso de cuatro semestres con 
una hora de clase con prácticas de laboratorio. En la 
sección con prácticas de laboratorio 11 estudiantes ob- 
tuvieron una calificación promedio de 85 con una des- 
viación estándar de 4.7; mientras que en la sección sin 
prácticas de laboratorio 17 estudiantes obtuvieron una 
calificación promedio de 79 con una desviación están- 
dar de 6.1. ¿Diría usted que el curso que incluyó prác- 
ticas de laboratorio aumentó la calificación promedio 
hasta en 8 puntos? Utilice un valor P en su conclusión 
y suponga que las poblaciones se distribuyen de forma 
aproximadamente normal con varianzas iguales. 


10.35 Para indagar si un nuevo suero frena el desa- 
rrollo de la leucemia se seleccionan 9 ratones, todos 
en una etapa avanzada de la enfermedad. Cinco rato- 
nes reciben el tratamiento y cuatro no. Los tiempos de 
supervivencia, en años, a partir del momento en que 
comienza el experimento son los siguientes: 


Con tratamiento| 2.1 5.3 14 46 0.9 
Sin tratamiento | 1.9 0.5 2.8 31 
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A un nivel de significancia de 0.05, ¿se puede decir que 
el suero es eficaz? Suponga que las dos poblaciones 
se distribuyen de forma normal con varianzas iguales. 


10.36 Los ingenieros de una armadora de automóvi- 
les de gran tamaño están tratando de decidir si compra- 
rán neumáticos de la marca A o de la marca B para sus 
modelos nuevos. Con el fin de ayudarlos a tomar una 
decisión se realiza un experimento en el que se usan 12 
neumáticos de cada marca. Los neumáticos se utilizan 
hasta que se desgastan. Los resultados son los siguientes: 


Marca А: 
x, = 37,900 kilómetros, 


s, = 5100 kilómetros. 
Marca B: 


x, = 39,800 kilómetros, 
s, = 5900 kilómetros. 


Pruebe la hipótesis de que no hay diferencia en el 
desgaste promedio de las 2 marcas de neumáticos. 
Suponga que las poblaciones se distribuyen de forma 
aproximadamente normal con varianzas iguales. Use 
un valor P. 


10.37 En el ejercicio 9.42 de la página 295 pruebe la 
hipótesis de que el ahorro de combustible de los camio- 
nes compactos Volkswagen, en promedio, excede al de 
los camiones compactos Toyota equipados de forma 
similar, que utilizan 4 kilómetros por litro. Utilice un 
nivel de significancia de 0.10. 


10.38 Un investigador de la UCLA afirma que el 
promedio de vida de los ratones se puede prolongar 
hasta por 8 meses cuando se reducen las calorías en 
su dieta aproximadamente 40% desde el momento 
en que se destetan. Las dietas restringidas se enriquecen 
a niveles normales con vitaminas y proteínas. Suponga 
que a una muestra aleatoria de 10 ratones que tienen 
una vida promedio de 32.1 meses con una desviación 
estándar de 3.2 meses se les alimenta con una dieta nor- 
mal, mientras que a una muestra aleatoria de 15 rato- 
nes que tienen un promedio de vida de 37.6 meses con 
una desviación estándar de 2.8 meses se les alimenta 
con la dieta restringida. A un nivel de significancia de 
0.05 pruebe la hipótesis de que el promedio de vida 
de los ratones con esta dieta restringida aumenta 8 me- 
ses, contra la alternativa de que el aumento es menor 
de 8 meses. Suponga que las distribuciones de la es- 
peranza de vida con las dietas regular y restringida son 
aproximadamente normales con varianzas iguales. 


10.39 Los siguientes datos representan los tiempos 
de duración de películas producidas por 2 empresas 
cinematográficas: 


Empresa | Tiempo (minutos) 
1 102 86 98 109 92 
2 8l 165 97 134 92 87 114 
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Pruebe la hipótesis de que la duración promedio de las 
películas producidas por la empresa 2 excede al tiempo 
promedio de duración de las que produce la empresa 1 
en 10 minutos, contra la alternativa unilateral de que la 
diferencia es de menos de 10 minutos. Utilice un nivel de 
significancia de 0.1 y suponga que las distribuciones 
de la duración son aproximadamente normales con va- 
rianzas iguales. 


10.40 En un estudio realizado en Virginia Tech se 
compararon los niveles de ácido ascórbico en plasma 
en mujeres embarazadas fumadoras con los de muje- 
res no fumadoras. Para el estudio se seleccionaron 32 
mujeres que estuvieran en los últimos 3 meses de em- 
barazo, que no tuvieran padecimientos importantes y 
que sus edades fluctuaran entre los 15 y los 32 años. 
Antes de tomar muestras de 20 ml de sangre se pidió a 
las participantes que fueran en ayunas, que no tomaran 
sus suplementos vitamínicos y que evitaran alimentos 
con alto contenido de ácido ascórbico. A partir de las 
muestras de sangre se determinaron los siguientes va- 
lores de ácido ascórbico en el plasma de cada mujer, en 
miligramos por 100 mililitros: 


Valores de ácido ascórbico en plasma 


No fumadoras Fumadoras 
0.97 1.16 0.48 
0.72 0.86 0.71 
1.00 0.85 0.98 
0.81 0.58 0.68 
0.62 0.57 1.18 
1.32 0.64 1.36 
1.24 0.98 0.78 
0.99 1.09 1.64 
0.90 0.92 

0.74 0.78 

0.88 1.24 

0.94 1.18 


¿Existe suficiente evidencia para concluir que hay 
una diferencia entre los niveles de ácido ascórbico 
en plasma de mujeres fumadoras y no fumadoras? 
Suponga que los dos conjuntos de datos provienen de 
poblaciones normales con varianzas diferentes. Utilice 
un valor P. 


10.41 El Departamento de Zoología de Virginia Tech 
llevó a cabo un estudio para determinar si existe una 
diferencia significativa en la densidad de organismos 
en dos estaciones diferentes ubicadas en Cedar Run, 
una corriente secundaria que se localiza en la cuenca 
del río Roanoke. El drenaje de una planta de trata- 
miento de aguas negras y el sobreflujo del estanque de 
sedimentación de la Federal Mogul Corporation entran 
al flujo cerca del nacimiento del río. Los siguientes da- 
tos proporcionan las medidas de densidad, en número 
de organismos por metro cuadrado, en las dos estacio- 
nes colectoras: 
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Número de organismos por metro cuadrado 
Estación 1 Estación 2 


5030 4980 | 2800 2810 
13,700 11,910 | 4670 1330 
10,730 8130 | 6890 3320 
11,400 26,850 | 7720 1230 

860 17,660 | 7030 2130 

2200 22,800 | 7330 2190 

4250 1130 
15,040 1690 


A un nivel de significancia de 0.05, ¿podemos concluir 
que las densidades promedio en las dos estaciones son 
iguales? Suponga que las observaciones provienen de 
poblaciones normales con varianzas diferentes. 


10.42 Cinco muestras de una sustancia ferrosa se usa- 
ron para determinar si existe una diferencia entre un aná- 
lisis químico de laboratorio y un análisis de fluorescencia 
de rayos X del contenido de hierro. Cada muestra se di- 
vidió en dos submuestras y se aplicaron los dos tipos de 
análisis. A continuación se presentan los datos codifica- 
dos que muestran los análisis de contenido de hierro: 


Muestra 
Análisis 1 2 3 4 5 
Rayos X 20 20 23 21 24 
Químico 22 19 25 23 24 


Suponga que las poblaciones son normales y pruebe, 
al nivel de significancia de 0.05, si los dos métodos de 
análisis dan, en promedio, el mismo resultado. 


10.43 De acuerdo con informes publicados, el ejerci- 
cio en condiciones de fatiga altera los mecanismos que 
determinan el desempeño. Se realizó un experimento con 
15 estudiantes universitarios hombres, entrenados para 
realizar un movimiento horizontal continuo del brazo, de 
derecha a izquierda, desde un microinterruptor hasta una 
barrera, golpeando sobre la barrera en coincidencia con 
la llegada de una manecilla del reloj a la posición de las 
6 en punto. Se registró el valor absoluto de la diferencia 
entre el tiempo, en milisegundos, que toma golpear so- 
bre la barrera y el tiempo para que la manecilla alcance 
la posición de las 6 en punto (500 mseg). Cada parti- 
cipante ejecutó la tarea cinco veces en condiciones sin 
fatiga y con fatiga, y se registraron las siguientes sumas 
de las diferencias absolutas para las cinco ejecuciones: 


Diferencias absolutas de tiempo 


Sujeto Sin fatiga Con fatiga 
1 158 91 
2 92 59 
3 65 215 
4 98 226 
5 33 223 
6 89 91 
7 148 92 
8 58 177 
9 142 134 

10 117 116 
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11 74 153 
12 66 219 
13 109 143 
14 3T 164 
15 85 100 


Un aumento en la diferencia media absoluta de tiempo 
cuando la tarea se ejecuta en condiciones de fatiga apo- 
yaría la afirmación de que el ejercicio, en condiciones 
de fatiga, altera el mecanismo que determina el des- 
empeño. Suponga que las poblaciones se distribuyen 
normalmente y pruebe tal afirmación. 


10.44 En un estudio realizado por el Departamento 
de Nutrición Humana y Alimentos del Virginia Tech se 
registraron los siguientes datos sobre los residuos de 
ácido sórbico en jamón, en partes por millón, inmedia- 
tamente después de sumergirlo en una solución de sor- 
bato y después de 60 días de almacenamiento: 


Residuos de ácido sórbico en jamón 
Rebanada Antes del almacenamiento Después del almacenamiento 


1 224 116 
2 270 96 
3 400 239 
4 444 329 
5 590 437 
6 660 597 
7 1400 689 
8 680 576 


Si se supone que las poblaciones se distribuyen nor- 
malmente, ¿hay suficiente evidencia, a un nivel de 
significancia de 0.05, para decir que la duración del al- 
macenamiento influye en las concentraciones residua- 
les de ácido sórbico? 


10.45 El administrador de una empresa de taxis está 
tratando de decidir si el uso de neumáticos radiales en 
lugar de neumáticos regulares cinturados mejora el 
rendimiento de combustible. Se equipan 12 autos con 
neumáticos radiales y se conducen en un recorrido de 
prueba preestablecido. Sin cambiar a los conductores, 
los mismos autos se equipan con neumáticos regulares 
cinturados y se conducen nuevamente en el recorrido 
de prueba. Se registraron los siguientes datos sobre el 
consumo de gasolina, en kilómetros por litro: 


Kilómetros por litro 


Automóvil Llantas radiales Llantas cinturadas 
1 4.2 4.1 
2 4.7 4.9 
3 6.6 6.2 
4 7.0 6.9 
5 6.7 6.8 
6 4.5 44 
7 5.7 5.7 
8 6.0 5.8 
9 7.4 6.9 

10 4.9 4.7 
11 6.1 6.0 
12 5.2 4.9 
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¿Podemos concluir que los autos equipados con neu- 
máticos radiales ahorran más combustible que aquellos 
equipados con neumáticos cinturados? Suponga que 
las poblaciones se distribuyen normalmente. Utilice un 
valor P en su conclusión. 


10.46 Еп el ejercicio de repaso 9.91 de la página 313 
utilice la distribución т para probar la hipótesis de que 
la dieta reduce el peso de un individuo en 4.5 kilogra- 
mos, en promedio, contra la hipótesis alternativa de que 
la diferencia media en peso es menor que 4.5 kilogra- 
mos. Utilice un valor P. 


10.47 ¿Qué tan grande debería ser la muestra del 
ejercicio 10.20 para que la potencia de la prueba sea 
de 0.90, cuando la media verdadera es 5.20? Suponga 
que с = 0.24. 


10.48 Si la distribución del tiempo de vida en el 
ejercicio 10.19 es aproximadamente normal, ¿qué tan 
grande debería ser una muestra para que la probabili- 
dad de cometer un error tipo II sea 0.1 cuando la media 
verdadera es 35.9 meses? Suponga que с = 5.8 meses. 


10.49 ¿Qué tan grande debería ser la muestra del 
ejercicio 10.24 para que la potencia de la prueba sea de 
0.95 cuando la estatura promedio verdadera difiere 
de 162.5 en 3.1 centímetros? Utilice œ = 0.02. 


10.50 ¿Qué tan grandes deberían ser las muestras del 
ejercicio 10.31 para que la potencia de la prueba sea de 
0.95, cuando la diferencia verdadera entre los tipos 
de hilo A y B es 8 kilogramos? 


10.51 ¿Qué tan grande debería ser la muestra del 
ejercicio 10.22 para que la potencia de la prueba sea 
de 0.8 cuando el tiempo promedio verdadero dedicado 
a la meditación excede al valor hipotético en 1.2 о? 
Utilice а = 0.05. 


10.52 Se considera una prueba ѓа un nivel œ = 0.05 
para probar 


Ну: и = 14, 

H: u +14. 
¿Qué tamaño de muestra se necesita para que la pro- 
babilidad de no rechazar de manera errónea H, sea 0.1 
cuando la media de la población verdadera difiere de 14 


en 0.5? A partir de una muestra preliminar estimamos 
que ges 1.25. 


10.53 En el Departamento de Medicina Veterinaria 
del Virginia Tech se llevó a cabo un estudio para de- 
terminar si la “resistencia” de una herida de incisión 
quirúrgica es afectada por la temperatura del bisturí. 
En el experimento se utilizaron 8 perros. Se hicieron 
incisiones “calientes” y “frías” en el abdomen de cada 
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perro y se midió la resistencia. A continuación se pre- 
sentan los datos resultantes. 


Perro Bisturí Resistencia 
1 Caliente 5120 
1 Frío 8200 
2 Caliente 10,000 
2 Frío 8600 
3 Caliente 10,000 
3 Frío 9200 
4 Caliente 10,000 
4 Frío 6200 
5 Caliente 10,000 
Э Frío 10,000 
6 Caliente 7900 
6 Frío 5200 
7 Caliente 510 
7 Frío 885 
8 Caliente 1020 
8 Frío 460 


a) Escriba una hipótesis adecuada para determinar 
si la resistencia de las incisiones realizadas con 
bisturí caliente difiere en forma significativa de la 
resistencia de las realizadas con bisturí frío. 

b) Pruebe la hipótesis utilizando una prueba f pa- 
reada. Utilice un valor P en su conclusión. 


10.54 Se utilizaron 9 sujetos en un experimento para 
determinar si la exposición a monóxido de carbono tiene 
un impacto sobre la capacidad respiratoria. Los datos 
fueron recolectados por el personal del Departamento 
de Salud y Educación Física del Virginia Tech y analiza- 
dos en el Centro de Consulta Estadística en Hokie Land. 
Los sujetos fueron expuestos a cámaras de respiración, 
una de las cuales contenía una alta concentración de 
CO. Se realizaron varias mediciones de frecuencia 
respiratoria a cada sujeto en cada cámara. Los sujetos 
fueron expuestos a las cámaras de respiración en una 
secuencia aleatoria. Los siguientes datos representan la 
frecuencia respiratoria en número de respiraciones por 
minuto. Realice una prueba unilateral de la hipótesis de 
que la frecuencia respiratoria media es igual en los dos 
ambientes. Utilice œ = 0.05. Suponga que la frecuencia 
respiratoria es aproximadamente normal. 


Sujeto Con CO Sin CO 
1 30 30 
2 45 40 
3 26 25 
4 25 23 
5 34 30 
6 51 49 
7 46 41 
8 32 35 
9 30 28 
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10.8 Una muestra: prueba sobre una sola proporción 


Las pruebas de hipótesis que se relacionan con proporciones se requieren en muchas 
áreas. A los políticos les interesa conocer la fracción de votantes que los favorecerá en la 
siguiente elección. Todas las empresas manufactureras se preocupan por la proporción 
de artículos defectuosos cuando se realiza un embarque. Los jugadores dependen del 
conocimiento de la proporción de resultados que consideran favorables. 

Consideraremos el problema de probar la hipótesis de que la proporción de éxitos 
en un experimento binomial es igual a algún valor específico. Es decir, probaremos la 
hipótesis nula A, de que p = p, donde р es el parámetro de la distribución binomial. 
La hipótesis alternativa puede ser una de las alternativas unilaterales o bilaterales 
usuales: 


р<ро, P>Po, о p+*FPo. 


La variable aleatoria adecuada sobre la que basamos nuestro criterio de decisión 
es la variable aleatoria binomial X; aunque también podríamos usar el estadístico p = 
X/n. Los valores de X que están lejos de la media и = np, conducirán al rechazo de la 
hipótesis nula. Como X es una variable binomial discreta, es poco probable que se pueda 
establecer una región crítica cuyo tamaño sea exactamente igual a un valor preestable- 
cido de о. Por esta razón es preferible, al trabajar con muestras pequeñas, basar nuestras 
decisiones en valores P. Para probar la hipótesis 


Нер = Po 

H: P < Po 
utilizamos la distribución binomial para calcular el valor P 
P = P(X < x cuando p = pọ). 


El valor x es el número de éxitos en nuestra muestra de tamaño n. Si este valor P es me- 
nor o igual que о, nuestra prueba es significativa al nivel о y rechazamos H, a favor de 
Н,. De manera similar, para probar la hipótesis 


HP = Py 
H: pP > Py 
al nivel de significancia а, calculamos 


Р = Р(Х > x cuando p = po) 


y rechazamos Н, a favor de Н, si este valor P es menor o igual que о. Finalmente, рага 
probar la hipótesis 


HP = Py 
H: p F Pp 
a un nivel de significancia о, calculamos 


P =2P(X < xcuando p = po) si x< про 


Р =2P(X >x cuando p = ро) six > npo 
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y rechazamos H, a favor de Н, si el valor P calculado es menor o igual que а. 
Los pasos para probar una hipótesis nula acerca de una proporción contra varias 
alternativas usando las probabilidades binomiales de la tabla A.1 son los siguientes: 


Prueba de una 
proporción 
(muestras 
pequeñas) 


1.Н:р=ру 

2. Una de las alternativas Н:р<р„р>р„ор ж Po 

3. Elegir un nivel de significancia igual a о. 

4. Estadístico de prueba: variable binomial X con p = p, 

5. Cálculos: obtener x, el número de éxitos, y calcular el valor P adecuado. 
6. Decisión: sacar las conclusiones apropiadas con base en el valor P. 


Ejemplo 10.9: | Un constructor afirma que en 70% de las viviendas que se construyen actualmente en la 


Solución: 


ciudad de Richmond, Virginia, se instalan bombas de calor. ¿Estaría de acuerdo con esta 
afirmación si una encuesta aleatoria de viviendas nuevas en esta ciudad revelara que 8 de 
15 tienen instaladas bombas de calor? Utilice un nivel de significancia de 0.10. 


1. H; p = 0.7. 

2. H: p + 07. 

3. а = 0.10. 

4. Estadístico de prueba: Variable binomial X con p = 0.7 уп = 15. 

5. Cálculos: x = 8 y np, = (15)(0.7) = 10.5. Por lo tanto, de la tabla А.І, el valor P 


calculado es 


8 
Р = 2Р(Х < 8 cuando р = 0.7) = 2 У | Рх; 15, 0.7) = 0.2622 > 0.10. 
x=0 


6. Decisión: No rechazar Н. Concluir que no hay razón suficiente para dudar de la 
afirmación del constructor. 2 
En la sección 5.2 aprendimos que cuando n es pequeña las probabilidades bino- 
miales se pueden obtener de la fórmula binomial real o de la tabla A.1. Para n grande 
se requieren procedimientos de aproximación. Cuando el valor hipotético p, está muy 
cerca de 0 o de 1 se puede utilizar la distribución de Poisson con parámetro u = пру. Sin 
embargo, para n grande por lo general se prefiere la aproximación de la curva normal, 
con los parámetros и = np, y с? = np,q,, la cual es muy precisa, siempre y cuando р, no 
esté demasiado cerca de 0 o de 1. Si utilizamos la aproximación normal, el valor z para 
probar p = p, es dado por 


_x=nmpo_ P-—Po 


V продо Е vpogo/n. 


que es un valor de la variable normal estándar Z. Por consiguiente, para una prueba 
de dos colas al nivel de significancia о, la región crítica es z < —z,,, O Z > г, Para la 
alternativa unilateral p < p,, la región crítica es z < —z,, y para la alternativa p > p, la 
región crítica es z >. 


10.9 Dos muestras: pruebas sobre dos proporciones 363 


Ejemplo 10.10: | Se considera que un medicamento que se prescribe comúnmente para aliviar la tensión 
nerviosa tiene una eficacia de tan sólo 60%. Los resultados experimentales de un nuevo 
fármaco administrado a una muestra aleatoria de 100 adultos que padecían tensión ner- 
viosa revelaron que 70 de ellos sintieron alivio. ¿Esta evidencia es suficiente para con- 
cluir que el nuevo medicamento es mejor que el que se prescribe comúnmente? Utilice 
un nivel de significancia de 0.05. 

Solución: 1. H; p = 0.6. 


2. H: p > 0.6. 

3. а = 0.05. 

4. Región crítica: z > 1.645. 

5. Cálculos: x = 70, п = 100, р = 70/100 = 0.7 y 


1—0. 
z= — O06 _204P=P(Z > 204) < 0.0207. 


y (0.6)(0.4) /100 


6. Decisión: Rechazar Н, y concluir que el nuevo fármaco es mejor. 


10.9 Dos muestras: pruebas sobre dos proporciones 


A menudo surgen situaciones en las que se desea probar la hipótesis de que dos propor- 
ciones son iguales. Por ejemplo, podemos tratar de mostrar evidencia de que la proporción 
de médicos que son pediatras en un estado es igual a la proporción de pediatras en otro 
estado. Quizás un individuo decida dejar de fumar sólo si se convence de que la propor- 
ción de fumadores con cáncer pulmonar excede a la proporción de no fumadores con ese 
tipo de cáncer. 

En general, deseamos probar la hipótesis nula de que dos proporciones, o paráme- 
tros binomiales, son iguales. Es decir, probamos p, = p, contra una de las alternativas 
P, < P» р, > р, ор, F p, Desde luego, esto es equivalente a probar la hipótesis nula 
de que p, — р, = 0 contra una de las alternativas p, – p, < 0, p, — P, > 00р, — P, # 
О. El estadístico sobre el que basamos nuestra decisión es la variable aleatoria Р, — Р,. 
Se seleccionan al azar muestras independientes de tamaños n, y n, de dos poblaciones 
binomiales y se calcula la proporción de éxitos P, y Р, рага las dos. muestras. 

En la construcción de intervalos de confianza para p, y p, observamos, para n, y 
n, suficientemente grandes, que el estimador puntual p, menos p, estaba distribuido de 
forma casi normal con media 


Hp _p, = рі — рг 


y varianza 
2 Рі + Pop 
РИ - Ay n2 


Por lo tanto, es posible establecer la(s) región(es) crítica(s) usando la variable normal 
estándar 
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_ (Ё, — Ё) – (pi — рә) 


м/р ті +p2q2/n2 


Cuando H, es verdadera, podemos sustituir P,=P,=P Yq, = 9,= 4 (donde p y q 
son los valores comunes) en la fórmula anterior para Z y obtener la forma 
Р-Р, 


\у/ра(1/п + 1/n2) 


Sin embargo, para calcular un valor de Z debemos estimar los parámetros p y q que 
aparecen en el radical. Al agrupar los datos de ambas muestras el estimado agrupado 
de la proporción p es 


Z 


a Xi tx 

p= П 1 + п? ? 

donde x, y x, son el número de éxitos en cada una de las dos muestras. Al sustituir р por 
руд = 1 — p por q, el valor z para probar p, = p, se determina a partir de la fórmula 


Di — Î2 


VPA /п\ +1/n2) 


Las regiones críticas para las hipótesis alternativas adecuadas se establecen como antes, 
utilizando puntos críticos de la curva normal estándar. En consecuencia, para la alter- 
nativa p, F p,, al nivel de significancia а, la región crítica es Z < —Z ap O Z > Z, Рага 
una prueba donde la alternativa es p, < p,, la región crítica será z < —z,; y cuando la 
alternativa es Р, > Py la región crítica será z > To 


Ejemplo 10.11: | Se organizará una votación entre los residentes de una ciudad y el condado circundante 


Solución: 


para determinar si se aprueba una propuesta para la construcción de una planta química. 
Como el lugar en el que se propone construirla está dentro de los límites de la ciudad, 
muchos votantes del condado consideran que la propuesta será aprobada debido a la gran 
proporción de votantes que está a favor de que se construya. Se realiza una encuesta para 
determinar si hay una diferencia significativa en la proporción de votantes de la ciudad y 
los votantes del condado que favorecen la propuesta. Si 120 de 200 votantes de la ciudad 
favorecen la propuesta y 240 de 500 residentes del condado también lo hacen, ¿estaría 
usted de acuerdo en que la proporción de votantes de la ciudad que favorecen la propues- 
ta es mayor que la proporción de votantes del condado? Utilice un nivel de significancia 
de а = 0.05. 

Sean p, y p, las proporciones verdaderas de votantes en la ciudad y el condado, respecti- 
vamente, que favorecen la propuesta. 


1. H; pP, =P»: 
2. H: p > Pp, 

3. а = 0.05 

4. Región crítica: z > 1.645. 
5 


. Cálculos: 
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А Xi 120 A x2 240 
= — = — = 0.60, = — = — = 0.48, 
Pi a 200 P = a 500 и 
3 120 + 240 
pa Б ЖЕ AO SL 
ni+n> 200 + 500 
Por lo tanto, 
_ 0.60 — 0.48 —29 
\/(0.51)(0.49)(1/200 + 1 /500) / 
P = P(Z > 2.9) = 0.0019. 
6. Decisión: Rechazar H, y estar de acuerdo en que la proporción de votantes de 
la ciudad a favor de la propuesta es mayor que la proporción de votantes del 
condado. J 
Ejercicios 


10.55 Un experto en mercadotecnia de una empresa 
fabricante de pasta considera que 40% de los amantes 
de la pasta prefieren la lasagna. Si 9 de 20 amantes de 
la pasta eligen la lasagna sobre otras pastas, ¿qué se 
puede concluir acerca de la afirmación del experto? 
Utilice un nivel de significancia de 0.05. 


10.56 Suponga que, en el pasado, 40% de todos los 
adultos estaban a favor de la pena capital. ¿Existe al- 
guna razón para creer que la proporción de adultos que 
está a favor de la pena capital ha aumentado si, en una 
muestra aleatoria de 15 adultos, 8 están a favor de la 
pena capital? Utilice un nivel de significancia de 0.05. 


10.57 Se está considerando utilizar un nuevo aparato 
de radar para cierto sistema de misiles de defensa. El 
sistema se verifica experimentando con una aeronave 
en la que se simula una situación en la que alguien 
muere y otra en la que no ocurre ninguna muerte. Si 
en 300 ensayos ocurren 250 muertes, al nivel de sig- 
nificancia de 0.04, acepte o rechace la afirmación de 
que la probabilidad de una muerte con el nuevo sistema 
no excede a la probabilidad de 0.8 del sistema que se 
utiliza actualmente. 


10.58 Se cree que al menos 60% de los residentes de 
cierta área están a favor de una demanda de anexión 
de una ciudad vecina. ¿Qué conclusión extraería si sólo 
110 en una muestra de 200 votantes están a favor de 
la demanda? Utilice un nivel de significancia de 0.05. 


10.59 Una empresa petrolera afirma que en una 
quinta parte de las viviendas de cierta ciudad la gente 
utiliza petróleo como combustible para calentarlas. 
¿Existen razones para creer que en menos de una 
quinta parte de las viviendas la gente utiliza este com- 
bustible para calentarlas si, en una muestra aleatoria 


de 1000 viviendas de esa ciudad, se encuentra que 136 
utilizan petróleo como combustible? Utilice un valor P 
en su conclusión. 


10.60 En cierta universidad se estima que а lo sumo 
25% de los estudiantes van en bicicleta a la escuela. 
¿Parece que ésta es una estimación válida si, en una 
muestra aleatoria de 90 estudiantes universitarios, se 
encuentra que 28 van en bicicleta a la escuela? Utilice 
un nivel de significancia de 0.05. 


10.61 En un invierno con epidemia de influenza los 
investigadores de una conocida empresa farmacéutica 
encuestaron a los padres de 2000 bebés para determi- 
nar si el nuevo medicamento de la empresa era eficaz 
después de dos días. De 120 bebés que tenían influenza 
y que recibieron el medicamento, 29 se curaron en dos 
días о menos. De 280 bebés que tenían influenza pero 
no recibieron el fármaco, 56 se curaron en dos días o 
menos. ¿Hay alguna indicación significativa que apoye 
la afirmación de la empresa sobre la eficacia del medi- 
camento? 


10.62 Еп un experimento de laboratorio controlado, 
científicos de la Universidad de Minnesota descubrie- 
ron que 25% de cierta cepa de ratas sujetas a una dieta 
con 20% de grano de café y luego forzadas a consumir 
un poderoso químico causante de cáncer desarrollaron 
tumores cancerosos. Si el experimento se repite, y 16 
de 48 ratas desarrollan tumores, ¿existen razones para 
creer que la proporción de ratas que desarrollan tu- 
mores cuando se someten a esta dieta se incrementa? 
Utilice un nivel de significancia de 0.05. 


10.63 Ер un estudio que se realizó para estimar la 
proporción de residentes de cierta ciudad y sus subur- 
bios que están a favor de que se construya una planta 
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de energía nuclear se encontró que 63 de 100 residentes 
urbanos están a favor de la construcción, mientras que 
sólo 59 de 125 residentes suburbanos la apoyan. ¿Hay 
una diferencia significativa entre la proporción de resi- 
dentes urbanos y suburbanos que están a favor de que 
se construya la planta nuclear? Utilice un valor P. 


10.64 En un estudio sobre la fertilidad de mujeres 
casadas, realizado por Martin O”Connell y Carolyn С. 
Rogers para la Oficina del Censo en 1979, se seleccio- 
naron al azar dos grupos de mujeres casadas de entre 
25 y 29 años de edad y sin hijos, y a cada una se le 
preguntó si planeaba tener un hijo en algún momento. 
Se seleccionó un grupo de mujeres con menos de dos 
años de casadas y otro de mujeres con cinco años de 
casadas. Suponga que 240 de 300 mujeres con menos 
de dos años de casadas planean tener un hijo algún día, 
en comparación con 288 de las 400 mujeres con cinco 
años de casadas. ¿Podemos concluir que la proporción 
de mujeres con menos de dos años de casadas que pla- 
nean tener hijos es significativamente mayor que la 
proporción de mujeres con cinco años de casadas que 
también planean tenerlos? Utilice un valor P. 
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10.65 Una comunidad urbana quiere demostrar que 
la incidencia de cáncer de mama es mayor en su locali- 
dad que en una área rural vecina. (Se encontró que los 
niveles de PCB son más altos en el suelo de la comuni- 
dad urbana). Si descubre que en la comunidad urbana 
20 de 200 mujeres adultas tienen cáncer de mama y 
que en la comunidad rural 10 de 150 mujeres adultas lo 
tienen, ¿podría concluir, con un nivel de significancia 
de 0.05, que el cáncer de mama prevalece más en la 
comunidad urbana? 


10.66 Proyecto de grupo: Para este proyecto el 
grupo se debe dividir en parejas. Suponga que se su- 
pone que al menos 25% de los estudiantes de su univer- 
sidad hacen más de dos horas de ejercicio por semana. 
Reúna datos de una muestra aleatoria de 50 estudiantes 
y pregunte a cada uno si se ejercita durante al menos 
dos horas por semana; luego haga los cálculos necesa- 
rios para rechazar o no rechazar la suposición anterior. 
Demuestre todo el procedimiento y utilice un valor P 
en sus conclusiones. 


10.10 Pruebas de una y dos muestras referentes a varianzas 


En esta sección estudiaremos la prueba de hipótesis relacionada con varianzas o desvia- 
ciones estándar de la población. No son poco comunes las aplicaciones de pruebas de 
una y dos muestras sobre varianzas. Los ingenieros y los científicos constantemente se 
enfrentan a estudios donde se les pide demostrar que las mediciones que tienen que ver 
con productos o procesos cumplen con las especificaciones que fijan los consumidores. 
Las especificaciones a menudo se cumplen si la varianza del proceso es suficientemente 
pequeña. También existe interés por experimentos que comparan métodos o procesos 
donde la reproducibilidad o variabilidad inherentes se deben comparar de manera for- 
mal. Además, para determinar si no se cumple la suposición de varianzas iguales, con 
frecuencia se aplica una prueba que compara dos varianzas antes de llevar a cabo una 
prueba і sobre dos medias. 

Empecemos por considerar el problema de probar la hipótesis nula H, de que la va- 
rianza de la población с? es igual а un valor específico со contra una de las alternativas 
comunes 0? < 0%, 0? > 0,0 0? + 0%. El estadístico apropiado sobre el que basamos 
nuestra decisión es el estadístico chi cuadrada del teorema 8.4, el cual se utilizó en el 
capítulo 9 para construir un intervalo de confianza para о?. Por lo tanto, si suponemos 
que la distribución de la población que se muestrea es normal, el valor de chi cuadrada 
para probar 0? = 0 es dado por 


2 (= 1)52 
=, 
00 
donde л es el tamaño de la muestra, 52 еѕ la varianza muestral y сё es el valor de o? dado 
por la hipótesis nula. Si A, es verdadera, x? es un valor de la distribución chi cuadrada 
con у = п — 1 grados de libertad. En consecuencia, para una prueba de dos colas a un 


10.10 Pruebas de una y dos muestras referentes a varianzas 367 


nivel de significancia а, la región crítica es Хх; «ж, рож > Xaj , Рага la alternativa 
unilateral т? < со, la тер1бп crítica es X? < Xia; y para la Aheriariva unilateral 0? > т, 
la región crítica es x? > X}. 


Robustez de la prueba ү? para la suposición de normalidad 


Tal vez el lector se habrá dado cuenta de que varias pruebas dependen, al menos en teo- 
ría, de la suposición de normalidad. En general muchos procedimientos en estadística 
aplicada tienen fundamentos teóricos que dependen de la distribución normal. Estos 
procedimientos varían en el grado en que dependen de la suposición de la normalidad. 
A un procedimiento que es razonablemente insensible a esta suposición se le denomina 
procedimiento robusto, es decir, robusto para la normalidad. La prueba x?*sobre una 
sola varianza no es robusta en absoluto para la normalidad, es decir, el éxito práctico del 
procedimiento depende de la normalidad. Como resultado, el valor P calculado podría 
ser notoriamente diferente del valor P verdadero si la población de la que se toma la 
muestra no es normal. De hecho, resulta muy plausible que un valor P estadísticamente 
significativo no sea una verdadera señal de Н: с + O, sino que un valor significativo 
sea el resultado de haber violado las suposiciones de normalidad. Por lo tanto, el analista 
debería utilizar esta prueba x? específica con precaución. 


Ejemplo 10.12: | Un fabricante de baterías para automóvil afirma que la duración de sus baterías se distri- 


Solución: 


buye de forma aproximadamente normal con una desviación estándar igual a 0.9 años. 
Si una muestra aleatoria de 10 de tales baterías tiene una desviación estándar de 1.2 años, 
¿considera que с > 0.9 años? Utilice un nivel de significancia de 0.05. 


1. Н: о? = 0.81. 
2. Н: о? > 0.81. 
3. а = 0.05. 
4. Región crítica: En la figura о 19 vemos que se rechaza la hipótesis nula cuando x? 
> 16.919, donde х= “94 con v = 9 grados de libertad. 
v=9 
0.05 2 
0 16.919 X 


Figura 10.19: Región crítica para la hipótesis alternativa с> 0.9. 
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5. Cálculos: $ = 1.44, п = 10 y 


2 _ (9)(1.44) 
= 2-1 =160, P = 0.07. 
0.81 


6. Decisión: El estadístico ҳ? по es significativo al nivel 0.05. Sin embargo, con base 
en el valor Р de 0.07, hay evidencia de que с > 0.9. 

Consideremos ahora el problema de probar la igualdad de las varianzas сі y озде 

dos poblaciones. Esto es, probaremos la hipótesis nula H, de que 0% = 05 contra una 


de las alternativas usuales 
Ж 2 
o <o, o >o, o o FoR. 


Para muestras aleatorias independientes de tamaños n, y n,, respectivamente, de las dos 
poblaciones, el valor f para probar с = ø es el cociente 


donde sí у så son las varianzas calculadas de las dos muestras. Si las dos poblaciones 
se distribuyen de forma aproximadamente normal y la hipótesis nula es verdadera, de 
acuerdo con el teorema 8.8 el cociente f = sí / 55 es un valor de la distribución F con 
v =n,-1yv,=n,- 1 grados de libertad. Por lo tanto, las regiones críticas de tamaño а 
que corresponden а las alternativas unilaterales o? < сз y o? > 07 son, respectivamente, 
F< fiae va) y F> flv, v,). Para la alternativa bilateral от 4 05 la región crítica es 


F< Fano YD OF > fano V 


Ejemplo 10.13: | Al probar la diferencia en el desgaste abrasivo de los dos materiales del ejemplo 10.6 
supusimos que las dos varianzas de la población desconocidas eran iguales. ¿Se justifica 
tal suposición? Utilice un nivel de significancia de 0.10. 
Solución: Sean с? y сз las varianzas de la población para el desgaste abrasivo del material 1 y del 
material 2, respectivamente. 


1. H; o = 02 


2. Н: от # о» 
3. а = 0.10. 
4. Región crítica: En la figura 10.20 observamos que f (11, 9) = 3.11, y, usando el 


teorema 8.7, encontramos 


Ро.95(11, 9) = 0.34. 


Fo.os(9, 11) — 


Por lo tanto, se rechaza la hipótesis nula cuando f < 0.34 o f > 3.11, donde f = sí / 
s3 con v, = Пур, = 9 grados de libertad. 
5. Cálculos: 51 = 16, хз = 25, por ende, f = £ = 0.64. 


6. Decisión: no rechazar Н. Concluir que no hay suficiente evidencia de que las va- 
rianzas sean diferentes. И | 


Ejercicios 


20.05 


369 


0 0.34 


Figura 10.20: Región crítica para la hipótesis alternativa o? 3 03. 


Prueba F para la prueba de varianzas con el SAS 


La figura 10.18 de la página 356 presenta la impresión de una prueba г de dos muestras 
donde se comparan dos medias de los datos de los tallos en el ejercicio 9.40. La gráfica 
de caja y bigote que se observa en la figura 10.17 de la página 355 sugiere que las varian- 
zas no son homogéneas у, por consiguiente, el estadístico г y su valor Р correspondiente 
son relevantes. Observe también que la impresión muestra el estadístico F para Н: с, 
= о, con un valor Р de 0.0098, que es evidencia adicional de que se debe esperar más 


variabilidad cuando se aplica el tratamiento con nitrógeno que cuando no se aplica. 


Ejercicios 


10.68 Рог experiencia se sabe que el tiempo que se 
requiere para que los estudiantes de preparatoria de 
último año contesten una prueba estandarizada es una 
variable aleatoria normal con una desviación estándar 
de 6 minutos. Pruebe la hipótesis de que с = 6 contra 
la alternativa de que с < 6 si una muestra aleatoria de 
los tiempos para realizar la prueba de 20 estudiantes 
de preparatoria de último año tiene una desviación es- 
tándar 5 = 4.51. Utilice un nivel de significancia de 0.05. 


10.70 Datos históricos indican que la cantidad de di- 
nero que aportaron los residentes trabajadores de una 
ciudad grande para un escuadrón de rescate voluntario 
es una variable aleatoria normal con una desviación es- 
tándar de $1.40. Se sugiere que las contribuciones al 
escuadrón de rescate sólo de los empleados del departa- 
mento de sanidad son mucho más variables. Si las con- 
tribuciones de una muestra aleatoria de 12 empleados 
del departamento de sanidad tienen una desviación es- 
tándar de $1.75, ¿podemos concluir a un nivel de signi- 
ficancia de 0.01 que la desviación estándar de las 
contribuciones de todos los trabajadores de sanidad es 
mayor que la de todos los trabajadores que viven en di- 
cha ciudad? 


10.71 Se dice que una máquina despachadora de 
bebida gaseosa está fuera de control si la varianza 
de los contenidos excede a 1.15 decilitros. Si una mues- 
tra aleatoria de 25 bebidas de esta máquina tiene una 
varianza de 2.03 decilitros, ¿esto indica, a un nivel 
de significancia de 0.05, que la máquina está fuera de 
control? Suponga que los contenidos se distribuyen 
de forma aproximadamente normal. 
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10.72 Prueba ес? = 0% para una muestra grande: 
Cuando n > 30 podemos probar la hipótesis nula de 
que 0? = 050 o = с, calculando 


z= S — О) 
0/vV2n" 


que es un valor de una variable aleatoria cuya distri- 
bución muestral es aproximadamente la distribución 
normal estándar. 

a) Con referencia al ejemplo 10.4, a un nivel de sig- 
пібсапсіа de 0.05, pruebe si с = 10.0 años contra 
la alternativa de que ø + 10.0 años. 

b) Se sospecha que la varianza de la distribución de 
las distancias en kilómetros que un modelo nuevo 
de automóvil equipado con un motor diesel reco- 
rre con 5 litros de combustible es menor que la va- 
rianza de la distribución de distancias que recorre 
el mismo modelo equipado con un motor de gaso- 
lina de 6 cilindros, la cual se sabe es т? = 6.25. 
Si 72 recorridos de prueba con el modelo diesel 
tienen una varianza de 4.41, ¿podemos concluir, a 
un nivel de significancia de 0.05, que la varianza 
de las distancias recorridas por el modelo que fun- 
ciona con diesel es menor que la del modelo que 
funciona con gasolina? 


10.74 Enel ejercicio 10.41 de la página 358 pruebe la 
hipótesis а un nivel de significancia de 0.05 de que сї 
= (5 contra la alternativa de que o} + 03, donde с? у 
g% son las varianzas para el número de organismos por 
metro cuadrado de agua en los dos lugares diferentes 
de Cedar Run. 


10.75 Remítase al ejercicio 10.39 de la página 358 y 
pruebe la hipótesis de que тї = с> сопіга la alternativa 
de que сї + 03, donde сї y 03 son las varianzas para 
la duración de las películas producidas por la empresa 
1 y la empresa 2, respectivamente. Utilice un valor P. 


10.76 Se comparan dos tipos de instrumentos para 
medir la cantidad de monóxido de azufre en la atmós- 
fera en un experimento sobre la contaminación del 
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aire. Los investigadores desean determinar si los dos 
tipos de instrumentos proporcionan mediciones con la 
misma variabilidad. Se registran las siguientes lecturas 
para los dos instrumentos: 


Monóxido de azufre 
Instrumento A Instrumento B 


0.86 0.87 
0.82 0.74 
0.75 0.63 
0.61 0.55 
0.89 0.76 
0.64 0.70 
0.81 0.69 
0.68 0.57 
0.65 0.53 


Suponga que las poblaciones de mediciones se distri- 
buyen de forma aproximadamente normal y pruebe la 
hipótesis de que o, = с„ contra la alternativa de que 
0, F O, Use un valor P. 


10.78 Se sabe que las emisiones de hidrocarburos de 
los automóviles disminuyeron de forma drástica durante 
la década de 1980. Se realizó un estudio para comparar 
las emisiones de hidrocarburos a velocidad estacionaria, 
en partes por millón (ppm), para automóviles de 1980 y 
1990. Se seleccionaron al azar 20 automóviles de cada 
modelo y se registraron sus niveles de emisión de hidro- 
carburos. Los datos son los siguientes: 


Modelos 1980: 

141 359 247 940 882 494 306 210 105 880 
200 223 188 940 241 190 300 435 241 380 
Modelos 1990: 

140 160 20 20 223 60 20 95 360 70 

220 400 217 58 235 380 200 175 85 65 


Pruebe la hipótesis de que с, = о, contra la alternativa 
de que с, F O, Suponga que ambas poblaciones son 
normales. Utilice un valor P. 
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10.11 Prueba de la bondad de ajuste 


A lo largo de este capítulo nos ocupamos de la prueba de hipótesis estadística acerca de 
parámetros de una sola población, como и, ос? y p. Ahora consideraremos una prueba 
para determinar si una población tiene una distribución teórica específica. La prueba se 
basa en el nivel de ajuste que existe entre la frecuencia de ocurrencia de las observacio- 
nes en una muestra observada y las frecuencias esperadas que se obtienen a partir de la 
distribución hipotética. 

Para ilustrar lo anterior considere el lanzamiento de un dado. Suponemos que se trata 
de un dado legal, lo cual equivale a probar la hipótesis de que la distribución de resultados 
es la distribución uniforme discreta 


1 
= ж ==1 уу» 6: 


Suponga que el dado se lanza 120 veces y que se registra cada resultado. Teóricamente, 
si el dado está balanceado, esperaríamos que cada cara ocurriera 20 veces. Los resulta- 
dos se presentan en la tabla 10.4. 


Tabla 10.4: Frecuencias observadas y esperadas de 120 lanzamientos de un dado 


Cara 1 2 3 4 5 6 
Observadas 20 22 17 18 19 24 
Esperadas 20 20 20 20 20 20 


Al comparar las frecuencias observadas con las frecuencias esperadas correspon- 
dientes debemos decidir si es posible que tales discrepancias ocurran como resultado 
de fluctuaciones del muestreo, de que el dado está balanceado o no es legal o de que la 
distribución de resultados no es uniforme. Es práctica común referirse a cada resultado 
posible de un experimento como una celda. En nuestro caso tenemos 6 celdas. A conti- 
nuación se define el estadístico adecuado en el cual basamos nuestro criterio de decisión 
para un experimento que incluye k celdas. 

Una prueba de la bondad de ajuste entre las frecuencias observadas y espera- 
das se basa en la cantidad. 


Prueba de la 
bondad de 
ajuste 


e Е E (o; = 28 


i=l 


donde %?’es un valor de una variable aleatoria cuya distribución muestral se aproxima 
muy de cerca a la distribución chi cuadrada con v = k — 1 grados de libertad. Los sím- 
bolos o, y e, representan las frecuencias observada y esperada, respectivamente, para la 
¡-ésima celda. 

El número de grados de libertad asociado con la distribución chi cuadrada que se 
utiliza aquí es igual a k — 1, pues sólo hay k – 1 frecuencias de celdas libremente deter- 
minadas. Es decir, una vez que se determinan las frecuencias de k — 1 celdas, también se 
determina la frecuencia para la k-ésima celda. 

Si las frecuencias observadas se acercan a las frecuencias esperadas correspondien- 
tes, el valor X? será pequeño, lo cual indica un buen ajuste. Si las frecuencias observadas 
difieren de manera considerable de las frecuencias esperadas, el valor X? será grande y el 


ajuste deficiente. Un buen ajuste conduce а la aceptación de Н, mientras que un ajuste 
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deficiente conduce a su rechazo. Por lo tanto, la región crítica caerá en la cola derecha 
de la distribución chi cuadrada. Para un nivel de significancia igual a œ encontramos el 
valor crítico %4 de la tabla A.5 y, entonces, X’ > x? constituye la región crítica. El crite- 
rio de decisión que aquí se describe no se debería utilizar a menos que cada una de 
las frecuencias esperadas sea por lo menos igual a 5. Esta restricción podría requerir 
la combinación de celdas adyacentes, lo que dará como resultado una reducción en el 
número de grados de libertad. 
En la tabla 10.4 encontramos que el valor X? es 


(20-20? (22-20? (17—20)? 
Лап шыш шыш. 
18—202 (19—20? (24—20)? _ 
AA + у= 


17. 


Si usamos la tabla А.5, encontramos Xos = 11.070 para у = 5 grados de libertad. 
Como 1.7 es menor que el valor crítico, no se rechaza Н. Concluimos que no hay sufi- 
ciente evidencia de que el dado está desbalanceado. 

Como un segundo ejemplo probemos la hipótesis de que la distribución de fre- 
cuencias de la duración de baterías presentadas en la tabla 1.7 de la página 23 se puede 
aproximar mediante una distribución normal con media и = 3.5 y desviación estándar 
с = 0.7. Las frecuencias esperadas para las 7 clases (celdas) que se listan en la tabla 
10.5 se obtienen calculando las áreas bajo la curva normal hipotética que caen entre los 
diversos límites de clase. 


Tabla 10.5: Frecuencias observadas y esperadas para la duración de las baterías supo- 
niendo normalidad 


Límites de clase о е; 
1.45 – 1.95 2 0.5 
1.95 – 2.45 1 p 2.1 | 8.5 
2.45 —2.95 4 5.9 
2.95 —3.45 15 10.3 
3.45 – 3.95 10 10.7 
3.95 — 4.45 5 7.0 
4.45 —4.95 3 ps 3.5 |05 


Por ejemplo, los valores z que corresponden a los límites de la cuarta clase son 


2.95 — 3.5 3.45 — 3.5 
21 =— ут 707 у 2=—7 =—0.07. 
En la tabla A.3 encontramos que el área entre z, = —0.79 y z, = —0.07 es 


área = Р(—0.79 < Z <—0.07) = P(Z < —0.07) — P(Z < —0.79) 
= 0.4721 — 0.2148 = 0.2573. 


Por lo tanto, la frecuencia esperada para la cuarta clase es 
e4 = (0.2573)(40) = 10.3. 


Se acostumbra redondear estas frecuencias а un decimal. 
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La frecuencia esperada para el primer intervalo de clase se obtiene utilizando el área 
total bajo la curva normal a la izquierda del límite 1.95. Para el último intervalo de clase 
usamos el área total a la derecha del límite 4.45. Todas las demás frecuencias esperadas 
se determinan utilizando el método que se describe para la cuarta clase. Observe que 
combinamos clases adyacentes en la tabla 10.5 donde las frecuencias esperadas son 
menores que 5 (una regla general en la prueba de la bondad de ajuste). En consecuencia, 
el número total de intervalos se reduce de 7 a 4, lo cual da como resultado v = 3 grados 
de libertad. Entonces, el valor x?es dado por 


2 (1-85 (15-103? (10-107? (8—10.5)? 


8.5 10.3 10.7 105—0 


Сото el valor x? calculado es menor que Xos = 7.815 para 3 grados de libertad, по 
tenemos razón para rechazar la hipótesis nula y concluimos que la distribución normal 
con и = 3.5 y с = 0.7 proporciona un buen ajuste para la distribución de la duración de 
las baterías. 

La prueba de bondad de ajuste chi cuadrada es un recurso importante, en particular 
debido a que muchos procedimientos estadísticos en la práctica dependen, en un sentido 
teórico, de la suposición de que los datos reunidos provienen de un tipo de distribución 
específico. Como ya se expuso, la suposición de normalidad se hace muy a menudo. En 
los siguientes capítulos continuaremos haciendo suposiciones de normalidad con el fin de 
proporcionar una base teórica para ciertas pruebas e intervalos de confianza. 

En la literatura hay pruebas para evaluar la normalidad que son más poderosas que 
la prueba chi cuadrada. Una de tales pruebas es la prueba de Geary, la cual se basa en 
un estadístico muy sencillo que es el cociente de dos estimadores de la desviación están- 
dar de la población с. Suponga que se toma una muestra aleatoria Х|, X,,..., X, de una 
distribución normal, N(u, с). Considere el cociente 


VIY |х. |а 


У(Х, -X )2/п 
ya 


El lector debería reconocer que el denominador es un estimador razonable de с sin 
importar si la distribución es normal o no. El numerador es un buen estimador de © si 
la distribución es normal, pero podría sobrestimar o subestimar a с cuando haya des- 
viaciones de la normalidad. Así, los valores de U que difieren considerablemente de 1.0 
representan la señal de que se debe rechazar la hipótesis de normalidad. 

Para muestras grandes una prueba razonable se basa en la normalidad aproximada 
de U. El estadístico de prueba es, entonces, una estandarización de U dada por 


 U—1 
-0.2661/yn' 
Desde luego, el procedimiento de prueba incluye la región crítica bilateral. Calcula- 


mos un valor de z a partir de los datos y no rechazamos la hipótesis de normalidad 
cuando 


U 


—Za/2 < Z < 242. 


En la bibliografía se cita un artículo que trata sobre la prueba de Geary (Geary, 1947). 
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10.12 Prueba de independencia (datos categóricos) 


El procedimiento de prueba de chi cuadrada que se presentó en la sección 10.11 también 
se puede usar para probar la hipótesis de independencia de dos variables de clasificación. 
Suponga que deseamos determinar si las opiniones de los votantes residentes del estado 
de Illinois respecto a una nueva reforma fiscal son independientes de sus niveles de in- 
greso. Los sujetos de una muestra aleatoria de 1000 votantes registrados del estado de 
Ilinois se clasifican de acuerdo con su posición en las categorías de ingreso bajo, medio 
O alto, y si están a favor o no de la nueva reforma fiscal. Las frecuencias observadas se 
presentan en la tabla 10.6, la cual se conoce como tabla de contingencia. 


Tabla 10.6: Tabla de contingencia 2 x 3 


Nivel de ingreso 
Reforma fiscal Bajo Medio Alto Total 


A favor 182 213 203 598 
En contra 154 138 110 402 
Total 336 351 313 1000 


Una tabla de contingencia con r renglones y c columnas se denomina tabla r X c (“r 
x c” se lee “r por c”). Los totales de renglones y columnas en la tabla 10.6 se denomi- 
nan frecuencias marginales. Nuestra decisión de aceptar o rechazar la hipótesis nula, 
H,, de que la opinión de un votante respecto a la nueva reforma fiscal es independiente 
de su nivel de ingreso, se basa en qué tan bien se ajusten las frecuencias observadas en 
cada una de las 6 celdas de la tabla 10.6 y en las frecuencias que esperaríamos para cada 
celda si supusiéramos que H, es verdadera. Para encontrar estas frecuencias esperadas 
definamos los siguientes eventos: 


L: Una persona seleccionada está en el nivel de ingresos bajo. 

М: Una persona seleccionada está en el nivel de ingresos medio. 

H: Una persona seleccionada está en el nivel de ingresos alto. 

F: Una persona seleccionada está a favor de la nueva reforma fiscal. 


A: Una persona seleccionada está en contra de la nueva reforma fiscal. 


Podemos usar las frecuencias marginales para listar las siguientes estimaciones de 


probabilidad: 
1 1 
Ma. Ж йж м. в, 
1000 1000 1000 
PE) = 22, ra 
1000 1000 


Ahora bien, si H, es verdadera y las dos variables son independientes, deberíamos tener 


336 598 
P(LAOF)=P(L)P (F) = (тов) E 


336 402 
P(LNA)=P(L)P (A) = (т) (5005) 
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P(MNOF)=P(M)P(F) = (ту) (25%) 
P (MNA) = P (M) P (A) = (o) (5600) 
Р(НПЕ) =P(H)P(F) = (то) (тоо) 
P(HNA) = Р(Н)Р(А) = (то) (505). 


Las frecuencias esperadas se obtienen multiplicando la probabilidad de cada celda 
por el número total de observaciones. Como antes, redondeamos estas frecuencias a un 
decimal. Así, se estima que el número esperado de votantes de bajo ingreso en nuestra 


muestra que favorecen la reforma fiscal es 


( 2 ) (5005) (1000) = 4902) _ 200.9 


1000 1000 1000 


cuando H, es verdadera. La regla general para obtener la frecuencia esperada de cual- 


quier celda es dada por la siguiente fórmula: 


(total por columna) x (total por renglón) 


frecuencia esperada = 
gran total 


En la tabla 10.7 la frecuencia esperada para cada celda se registra entre parénte- 
sis, a un lado del valor observado verdadero. Observe que las frecuencias esperadas en 
cualquier renglón o columna se suman al total marginal apropiado. En nuestro ejemplo 
necesitamos calcular sólo las dos frecuencias esperadas en el renglón superior de la tabla 
10.7 y luego calcular las otras mediante sustracción. El número de grados de libertad 
asociados con la prueba chi cuadrada que aquí se usa es igual al número de frecuencias 
de celdas que se pueden llenar libremente cuando se nos proporcionan los totales mar- 
ginales y el gran total, y en este caso ese número es 2. Una fórmula sencilla que propor- 


ciona el número correcto de grados de libertad es 


v=(r=—1)(c—1). 


Tabla 10.7: Frecuencias observadas y esperadas 


Nivel de ingreso 


Reforma fiscal Bajo Medio Alto Total 
A favor 182 (200.9) 213 (209.9) 203 (187.2) 598 
En contra 154 (135.1) 138 (141.1) 110 (125.8) 402 
Total 336 351 313 1000 


Por lo tanto, para nuestro ejemplo v = (2 — 1)(3 — 1) = 2 grados de libertad. Para 
probar la hipótesis nula de independencia usamos el siguiente criterio de decisión: 
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Prueba de 
independencia 


Calcule 
(o; — ej)? 
Ж O 


і 


donde la sumatoria se extiende a todas las celdas rc en la tabla de contingencia г х с. 


Si X? > х;, con v = (r — 1)(с — 1) grados de libertad, rechace la hipótesis nula de inde- 
pendencia al nivel de significancia о; en otro caso no la rechace. 
Al aplicar este criterio a nuestro ejemplo encontramos que 


2 _ (182 — 200.9)? (213 — 209.9)? (203 — 187.2)? 
Е 200.9 209.9 187.2 
(154 — 135.1)2 (138 — 141.1)2 (110 — 125.8)? 
135.1 141.1 125.8 


= 7.85, 


Р = 0.02. 


En la tabla A.5 encontramos que Xos = 5.991 para у = (2 — 1)(3 — 1) = 2 grados de li- 
bertad. Rechazamos la hipótesis nula y concluimos que la opinión de un votante respecto 
a la reforma fiscal y su nivel de ingresos no son independientes. 

Es importante recordar que el estadístico sobre el cual basamos nuestra decisión 
tiene una distribución que sólo se aproxima por la distribución chi cuadrada. Los valores 
х? calculados dependen de las frecuencias de las celdas y, en consecuencia, son discre- 
tos. La distribución chi cuadrada continua parece aproximarse muy bien a la distribución 
de muestreo discreta de x?, siempre y cuando el número de grados de libertad sea mayor 
que 1. En una tabla de contingencia de 2 x 2, donde sólo tenemos 1 grado de libertad, se 
aplica una corrección llamada corrección de Yates para continuidad. 

La fórmula corregida entonces se convierte en 


A = e] 0.5)? 
2 Айу = (о; e;| | 
x (corregida) > > 


A i 
i 


Si las frecuencias de las celdas esperadas son grandes, los resultados corregidos y 
sin corrección son casi iguales. Cuando las frecuencias esperadas están entre 5 y 10, se 
debe aplicar la corrección de Yates. Para frecuencias esperadas menores que 5 se debería 
utilizar la prueba exacta de Fisher-Irwin. Un análisis de esta prueba se puede encontrar 
en Basic Concepts of Probability and Statistics de Hodges y Lehmann (2005; véase la 
bibliografía). Sin embargo, la prueba de Fisher-Irwin se puede evitar seleccionando una 
muestra grande. 


10.13 Prueba de homogeneidad 


Cuando probamos la independencia en la sección 10.12 seleccionamos una muestra 
aleatoria de 1000 votantes, y determinamos al azar los totales de renglón y de columna 
para nuestra tabla de contingencia. Otro tipo de problema para el que se aplica el método 
de la sección 10.12 es aquel en el cual los totales de renglón y de columna están predeter- 
minados. Suponga, por ejemplo, que decidimos de antemano seleccionar 200 demócra- 
tas, 150 republicanos y 150 independientes entre los votantes del estado de Carolina del 
Norte y registrar si están a favor de una iniciativa de ley para el aborto, si están en contra 
o si están indecisos. Las respuestas observadas se incluyen en la tabla 10.8. 
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Tabla 10.8: Frecuencias observadas 


Afiliación política 


Ley para el aborto Demócrata Republicano Independiente Total 
A favor 82 70 62 214 
En contra 93 62 67 222 
Indeciso 25 18 21 64 
Total 200 150 150 500 


Ahora bien, en vez de hacer una prueba de independencia, probamos la hipótesis de 
que las proporciones de población dentro de cada renglón son iguales. Es decir, proba- 
mos la hipótesis de que las proporciones de demócratas, republicanos e independientes 
que están a favor de la ley para el aborto son iguales; las proporciones de cada afiliación 
política contra la ley son iguales y las proporciones de cada afiliación política que están 
indecisos son iguales. Básicamente nos interesamos en determinar si las tres categorías de 
votantes son homogéneas en lo que se refiere a sus opiniones acerca de la iniciativa 
de ley para el aborto. A esta prueba se le conoce como prueba de homogeneidad. 

Al suponer homogeneidad de nuevo calculamos las frecuencias esperadas de las 
celdas multiplicando los totales de renglón y de columna correspondientes y después 
dividiendo entre el gran total. Luego continuamos el análisis utilizando el mismo esta- 
dístico chi cuadrada como antes. Пиѕігатоѕ este proceso en el siguiente ejemplo рага 
los datos de la tabla 10.8. 


Ejemplo 10.14: | Con respecto a los datos de la tabla 10.8 pruebe la hipótesis de que las opiniones en 


Solución: 


cuanto a la propuesta de ley para el aborto son las mismas en cada afiliación política. 
Utilice un nivel de significancia de 0.05. 
1. Н; Para cada opinión las proporciones de demócratas, republicanos e indepen- 
dientes son iguales. 


. H: Para al menos una opinión las proporciones de demócratas, republicanos e in- 
dependientes no son iguales. 


3. а = 0.05. 
4. Región crítica: x? > 9.488 con v = 4 grados de libertad. 
5. Cálculos: necesitamos calcular las 4 frecuencias de las celdas usando la fórmula de 


las frecuencias de las celdas esperadas de la página 375. Todas las demás frecuen- 
cias se obtienen mediante sustracción. Las frecuencias de las celdas observadas y 
esperadas se muestran en la tabla 10.9. 


Tabla 10.9: Frecuencias observadas y esperadas 


Afiliación política 


Ley para el aborto Demócrata Republicano Independiente Total 
A favor 82 (85.6) 70 (64.2) 62 (64.2) 214 
En contra 93 (88.8) 62 (66.6) 67 (66.6) 222 
Indeciso 25 (25.6) 18 (19.2) 21 (19.2) 64 
Total 200 150 150 500 
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Así, 
2 (82 — 85.6) (70 — 64.2)2 (62 — 64.2)? 
si 85.6 64.2 64.2 
(93 — 88.8)? (62 — 66.6)? (67 — 66.6)? 
88.8 66.6 66.6 
(25 — 25.6)? (18 — 19.2)? (21 — 19.2)? 
25.6 19.2 19.2 
= 1.53. 


6. Decisión: No rechazar Н. No hay suficiente evidencia para concluir que la propor- 
ción de demócratas, republicanos e independientes difiere para cada opinión expre- 
sada. 


Prueba para varias proporciones 


El estadístico chi cuadrada para probar la homogeneidad también se puede aplicar 
cuando se prueba la hipótesis de que k parámetros binomiales tienen el mismo valor. Por 
lo tanto, se trata de una extensión de la prueba que se presentó en la sección 10.9 para 
determinar las diferencias entre dos proporciones a una prueba para determinar diferen- 
cias entre k proporciones. En consecuencia, nos interesamos en probar la hipótesis nula 


Ho: р = р =з = Pk 
contra la hipótesis alternativa H, de que las proporciones de la población no son todas 
iguales. Para ejecutar esta prueba primero observamos muestras aleatorias independien- 
tes de tamaños n » yoo ЇЇ, de las k poblaciones y ordenamos los datos en una tabla de 
contingencia 2 x k, la tabla 10.10. 


Tabla 10.10: k muestras binomiales independientes 


Muestra: 1 2 э k 
Exitos Xi X2 ... Xk 
Fracasos Пр = Хр M2=X2 *** Mk —Xk 


De acuerdo con si los tamaños de las muestras aleatorias fueron predeterminados o 
si ocurrieron al azar, el procedimiento de prueba es idéntico a la prueba de homogenei- 
dad o a la prueba de independencia. Por lo tanto, las frecuencias de las celdas esperadas 
se calculan como antes y se sustituyen junto con las frecuencias observadas en el esta- 
dístico chi cuadrada 


Xx -YE 


7 і 
і 


соп 
у = (2 1)(к = 1) = к 1 


grados de libertad. 
Al seleccionar la región crítica apropiada de la cola superior de la forma x?> x4 
podemos llegar ahora a una decisión respecto a Н. 


10.13 Prueba de homogeneidad 
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Ejemplo 10.15: | En un estudio sobre un taller se reúne un conjunto de datos para determinar si la propor- 


Solución: 


ción de artículos defectuosos producida por los trabajadores fue la misma para el turno 
matutino, el vespertino y el nocturno. Los datos que se reunieron se muestran en la tabla 
10.11. 

Tabla 10.11: Datos para el ejemplo 10.15 


Turno: Matutino Vespertino Nocturno 
Defectuosos 45 55 70 
No defectuosos 905 890 870 


Utilice un nivel de significancia de 0.025 para determinar si la proporción de artículos 
defectuosos es la misma para los tres turnos. 

Representemos con р„р,ур, la proporción verdadera de artículos defectuosos para los 
turnos matutino, vespertino y nocturno, respectivamente. 


1. Нур, = P, = P} 
2. Н: рь P, y р, по son iguales 
3. а = 0.025. 
4. Región crítica: x? > 7.378 para v = 2 grados de libertad. 
5. Cálculos: En correspondencia con las frecuencias observadas o, = 45 y o, = 55, 
encontramos 
(9501170) (945)(170) 
= A = 57.0 = == 567. 
6 = 77835 TS 


Todas las demás frecuencias esperadas se calculan restando y se incluyen en la tabla 
10.12. 


Tabla 10.12: Frecuencias esperadas у observadas 


Turno: Matutino Vespertino Nocturno Total 
Defectuosos 45 (57.0) 55 (56.7) 70 (56.3) 170 
No defectuosos 905 (893.0) 890 (888.3) 870 (883.7) 2665 
Total 950 945 940 2835 
Ahora bien, 

2 _ (45— 57.0? (55— 56.7)? (70—56.3)? 
Е 57.0 56.7 56.3 
(905 — 893.0)? (890 — 888.3)? (870 — 883.7)2 — 629 
893.0 888.3 883.7 Еч 
Р = 0.04. 


. Decisión: no rechazamos H, con а = 0.025. Sin embargo, con el valor Р calculado 
ciertamente sería riesgoso concluir que la proporción de artículos defectuosos pro- 
ducidos es la misma para todos los turnos. JJ 

A menudo un estudio completo implica utilizar métodos estadísticos en la prueba 
de hipótesis, lo que se puede mostrar a los ingenieros o científicos utilizando los 
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dos estadísticos de prueba, junto con valores P y gráficas estadísticas. Las gráficas 
complementan los diagnósticos numéricos con imágenes que indican de forma intuitiva 
por qué resultan esos valores P, así como qué tan razonables (o no) son las suposiciones 
Operativas. 


10.14 Estudio de caso de dos muestras 


En esta sección consideramos un estudio que incluye un análisis gráfico y formal deta- 
llado, junto con la impresión por computadora con comentarios y conclusiones. En un 
estudio del análisis de datos que realizó el personal del Centro de Consulta Estadística 
del Virginia Tech se compararon dos materiales diferentes, la aleación A y la aleación B, 
en términos de la resistencia a la rotura. La aleación B es más costosa, aunque realmente 
se debería adoptar si se demuestra que es más fuerte que la aleación A. También se debe 
tomar en cuenta la consistencia del rendimiento de las dos aleaciones. 

Se seleccionaron muestras aleatorias de vigas hechas con cada aleación y la resis- 
tencia se midió en unidades de flexión de 0.001 pulgadas cuando se aplicó una fuerza 
fija en ambos extremos de la viga. Se utilizaron 20 especímenes para cada una de las dos 
aleaciones. Los datos se presentan en la tabla 10.13. 


Tabla 10.13: Datos para el estudio de caso de dos muestras 


Aleación A Aleación B 
88 82 87 75 81 80 
79 85 90 77 78 81 
84 88 83 86 78 77 
89 80 81 84 82 78 


81 85 80 80 
83 87 78 76 
82 80 83 85 
79 78 76 79 


Es importante que el ingeniero compare las dos aleaciones. Los investigadores están 
interesados en la resistencia y la reproducibilidad promedio, así como en determinar si 
hay una violación grave de la suposición de normalidad que requieren las pruebas ту F. 
Las figuras 10.21 y 10.22 son gráficas de cuantil-cuantil normales de las muestras de las 
dos aleaciones. 

Al parecer no hay ninguna violación grave de la suposición de normalidad. Además, 
la figura 10.23 presenta dos gráficos de caja y bigote en la misma gráfica. Los gráficos 
de caja y bigote sugieren que no hay una diferencia apreciable en la variabilidad de la 
flexión para las dos aleaciones. Sin embargo, al parecer la flexión media de la aleación 
B es significativamente menor, lo cual sugiere (al menos gráficamente) que la aleación B 
es más fuerte. Las medias muestrales y las desviaciones estándar son 


ўд = 83.55, зд = 3.663; ўв = 79.70, sg = 3.097. 


Га impresión del SAS рага el PROC TTEST se muestra en la figura 10.24. La prueba F 
sugiere que no hay una diferencia significativa en las varianzas (P = 0.4709) y el esta- 
dístico г de dos muestras para probar 


H U, = Mp 
H: H, > hy, 
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(@ = 3.59, Р = 0.0009) rechaza H, a favor de Н, y, por consiguiente, confirma lo que su- 
giere la información gráfica. Aquí utilizamos la prueba т que agrupa las varianzas de dos 
muestras a la luz de los resultados de la prueba F. Con base en este análisis la adopción 
de la aleación B sería lo adecuado. 


Significancia estadística y significancia científica o para la ingeniería 


Mientras que el estadístico se podría sentir muy cómodo con los resultados de la com- 
paración entre las dos aleaciones en el estudio de caso anterior, para el ingeniero queda 
un dilema. El análisis demostró una mejoría estadísticamente significativa utilizando 
la aleación B. Sin embargo, ¿realmente valdrá la pena aprovechar la diferencia que se en- 


90 86 
88 84 
86 82 
Е вд S 
5 
о о 80 
82 
78 
80 
76 
78 
—2 —1 0 1 2 —2 —1 0 1 2 
Cuantil normal Cuantil normal 


Figura 10.21: Gráfica de cuantil-cuantil normal de Figura 10.22: Gráfica de cuantil-cuantil normal de 


los datos para la aleación A. los datos para la aleación B. 
90 
85 
= 
О 
ра 
Ф 
ш 
80 
75 
Aleación A Aleación B 


Figura 10.23: Gráficos de caja y bigote para ambas aleaciones. 
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contró si la aleación В es más costosa? Este ejemplo resalta una cuestión muy importante 
que con frecuencia pasan por alto los estadísticos y los analistas de datos: la diferencia 
entre significancia estadística y significancia científica o para la ingeniería. Aquí la di- 
ferencia promedio en la flexión es y, — y, = 0.00385 pulgadas. En un análisis completo 
el ingeniero debe determinar si la diferencia es suficiente para justificar el costo adicio- 
nal a largo plazo. Ésta es una cuestión económica y de ingeniería. El lector debería com- 
prender que una diferencia significativa en términos estadísticos tan sólo implica que la 
diferencia en las medias muestrales que se encuentra en los datos difícilmente podría 
ocurrir por casualidad. Esto no implica que la diferencia en las medias de la población 
sea profunda o particularmente significativa en el contexto del problema. Por ejemplo, 
en la sección 10.4 se utilizó una impresión por computadora con comentarios para de- 
mostrar la evidencia de que un medidor de pH está, de hecho, sesgado. Es decir, esto no 
demuestra un pH promedio de 7.00 para el material en que se probó. Pero la variabilidad 
entre las observaciones en la muestra es muy pequeña. El ingeniero podría decidir que 
las desviaciones pequeñas de 7.0 representan el medidor de pH adecuado. 


The TTEST Procedure 


Alloy N Mean Std Dev Std Err 
Alloy A 20. 83.55 3.6631 0,8191 
Alloy B 20 79.7 3.0967 0.6924 

Variances DF t Value Pr > |+| 

Equal 38 3.59 0.0009 

Unequal 37 3559 0.0010 


Equality of Variances 
Num DF Den DF F Value Pr > F 
19 19 1.40 0.4709 


Figura 10.24: Impresión del SAS con comentarios para los datos de las aleaciones. 


Ejercicios 

10.79 Se supone que una máquina mezcla cacahua- 
tes, avellanas, castañas y pacanas a razón de 5:2:2:1. 
Se observa que una lata que contiene 500 de tales nue- 
ces mezcladas tiene 269 cacahuates, 112 avellanas, 74 
castañas y 45 pacanas. A un nivel de significancia de 
0.05 pruebe la hipótesis de que la máquina mezcla las 
nueces a una razón de 5:2:2:1. 


10.80 Las calificaciones de un curso de estadística 
para un semestre específico fueron las siguientes: 


Calificación, A В С D F 
F | 14 18 32 20 16 


Pruebe la hipótesis, a un nivel de significancia de 0.05, 
de que la distribución de calificaciones es uniforme. 


10.81 Se lanza un dado 180 veces con los siguientes 
resultados: 


|1 2 3 A4 5 6 
f |28 36 36 30 27 23 


¿Se trata de un dado balanceado? Utilice un nivel de 
significancia de 0.01. 


10.82 Se seleccionan tres canicas de una urna que 
contiene 5 canicas rojas y 3 verdes. Después de regis- 
trar el número X de canicas rojas, las canicas se reem- 
plazan en la urna y el experimento se repite 112 veces. 
Los resultados que se obtienen son los siguientes: 


*|0]0 1 2 3 
/ |1 31 55 25 


A un nivel de significancia de 0.05, pruebe la hipótesis 
de que los datos registrados se pueden ajustar a la dis- 
tribución hipergeométrica A(x; 8, 3, 5), x = 0, 1, 2, 3. 


Ejercicios 


10.83 Se lanza una moneda hasta que sale una cara 
y se registra el número de lanzamientos X. Después 
de repetir el experimento 256 veces, obtenemos los si- 
guientes resultados: 


xp1. 2 3 4:5 6 7 8 
f | 136 60 34 12 9 1 3 1 


A un nivel de significancia de 0.05, pruebe la hipótesis 
de que la distribución observada de X se puede ajustar a 
la distribución geométrica g(x; 1/2), x = 1, 2, 3,... 


10.84 En el ejercicio 1.18 de la página 31 pruebe 
la bondad de ajuste entre las frecuencias de clase ob- 
servadas y las frecuencias esperadas correspondien- 
tes de una distribución normal con и = 65 ус = 21. 
Utilice un nivel de significancia de 0.05. 


10.85 En el ejercicio 1.19 de la página 31 pruebe la 
bondad de ajuste entre las frecuencias de clase obser- 
vadas y las frecuencias esperadas correspondientes de 
una distribución normal con и = 1.8 ус = 0.4. Utilice 
un nivel de significancia de 0.01. 


10.86 En un experimento diseñado para estudiar la 

dependencia de la hipertensión con respecto a los há- 

bitos de fumar se tomaron los siguientes datos de 180 
individuos: 

No Fumadores Fumadores 

fumadores moderados empedernidos 


Con hipertensión 21 36 30 
Sin hipertensión 48 26 19 


Pruebe la hipótesis de que la presencia o ausencia de 
hipertensión es independiente de los hábitos de taba- 
quismo. Utilice un nivel de significancia de 0.05. 


10.87 Una muestra aleatoria de 90 adultos se clasifica 
de acuerdo con el género y el número de horas dedica- 
das a ver la televisión durante una semana: 


Género 
Masculino Femenino 
Más de 25 horas 15 29 
Menos de 25 horas 27 19 


Utilice un nivel de significancia de 0.01 y pruebe la 
hipótesis de que el tiempo dedicado a ver la televisión 
es independiente de si el espectador es hombre o mujer. 


10.88 Una muestra aleatoria de 200 hombres ca- 
sados, todos jubilados, se clasificó de acuerdo con la 
educación y el número de hijos: 


Número de hijos 


Educación 0-1 2-3 Más de 3 
Primaria 14 37 32 
Secundaria 19 42 17 
Universidad 12 17 10 
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Utilice un nivel de significancia de 0.05 para probar 
la hipótesis de que el tamaño de la familia es indepen- 
diente del nivel académico del padre. 


10.89 Un criminólogo realizó una investigación para 
determinar si la incidencia de ciertos tipos de delitos 
varía de una parte de una gran ciudad a otra. Los crí- 
menes específicos de interés eran el asalto, el robo de 
casas, el hurto y el homicidio. La siguiente tabla mues- 
tra el número de delitos cometidos en cuatro áreas de la 
ciudad durante el año pasado. 


Tipo de crimen 
Distrito Asalto Robo de casas Hurto Homicidio 


1 162 118 451 18 
2 310 196 996 25 
3 258 193 458 10 
4 280 175 390 19 


¿A partir de estos datos podemos concluir, a un nivel de 
significancia de 0.01, que la ocurrencia de estos tipos 
de delitos depende del distrito de la ciudad? 


10.90 De acuerdo con un estudio de la Universidad 
Johns Hopkins, publicado en American Journal of 
Public Health, las viudas viven más que los viudos. 
Considere los siguientes datos reunidos de superviven- 
cia de 100 viudas y 100 viudos después de la muerte 
del cónyuge: 


Años vividos Viuda Viudo 
Menos de 5 25 39 
де5а 10 42 40 
Más de 10 33 21 


Con un nivel de significancia de 0.05, ¿podemos con- 
cluir que las proporciones de viudas y viudos son iguales 
con respecto a los diferentes periodos que un cónyuge 
sobrevive luego de la muerte de su compañero? 


10.91 Las siguientes respuestas respecto al nivel de 
vida en el momento en que se aplicó una encuesta de 
opinión independiente a 1000 familias, comparadas 
con sus respuestas sobre su nivel de vida del año ante- 
rior, parecen coincidir con los resultados de un estudio 
publicado en Across the Board (junio de 1981): 


Nivel de vida 
Un poco No tan 
Periodo mejor Igual bueno Total 
1980: Ene. 72 144 84 300 
Мау 63 135 102 300 
Sept. 47 100 53 200 
1981: Ene. 40 105 53 200 


Pruebe la hipótesis de que las proporciones de familias 
dentro de cada nivel de vida son iguales para cada uno 
de los cuatro periodos. Utilice un valor P. 
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10.92 La enfermería de una universidad realizó un 
experimento para determinar el grado de alivio que 
brindan tres jarabes para la tos. Cada jarabe se probó 
en 50 estudiantes y se registraron los siguientes datos: 


Jarabe para la tos 


NyQuil Robitussin  Triaminic 
Sin alivio 11 13 9 
Cierto alivio 32 28 27 
Alivio completo 7 9 14 


Pruebe la hipótesis de que los tres remedios para la tos 
son igualmente efectivos. Utilice un valor P en sus con- 
clusiones. 

10.93 Рага determinar las posturas actuales acerca de 
rezar en escuelas públicas se llevó a cabo una investi- 
gación en 4 condados de Virginia. En la siguiente tabla 
se presentan las opiniones de 200 padres del condado 
de Craig, de 150 padres del condado de Giles, de 100 
padres del condado de Franklin y de 100 padres del 
condado de Montgomery: 


Condado 
Actitud Craig Giles Franklin Mont. 
A favor 65 66 40 34 
En contra 42 30 33 42 
Sin opinión 93 54 27 24 


Pruebe la homogeneidad de las posturas entre los 4 
condados respecto a rezar en escuelas públicas. Utilice 
un valor P en sus conclusiones. 

10.94 Se lleva a cabo una encuesta en Indiana, 
Kentucky y Ohio para determinar la postura de los vo- 
tantes respecto al transporte escolar. Un grupo de 200 
votantes de cada uno de estos estados proporcionó los 
siguientes resultados: 


Ejercicios de repaso 


10.97 Plantee las hipótesis nula y alternativa que 
utilizaría para probar las siguientes afirmaciones y de- 
termine de manera general en dónde se localiza la re- 
gión crítica: 

a) La cantidad promedio de nieve que cae en el lago 
George durante el mes de febrero es de 21.8 centí- 
metros. 

b) No más del 20% de los profesores de la universidad 
local contribuyó al fondo anual para donaciones. 

c) En promedio, los niños asisten a la escuela en un 
área de 6.2 kilómetros de sus casas en un suburbio 
de St. Louis. 

d) Al menos 70% de los automóviles nuevos del si- 
guiente año caerán en la categoría de compactos y 
semicompactos. 

e) La proporción de votantes que están a favor del 
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Postura del votante 


No 
Estado Apoya apoya Indeciso 
Indiana 82 97 21 
Kentucky 107 66 27 
Омо 93 74 33 


A un nivel de significancia de 0.05 pruebe la hipótesis 
nula de que las proporciones de votantes dentro de cada 
categoría de postura son las mismas en cada uno de los 
tres estados. 


10.95 Se lleva a cabo una investigación en dos ciuda- 
des de Virginia para determinar la opinión de los votan- 
tes respecto a dos candidatos a la gubernatura en una 
elección próxima. En cada ciudad se seleccionaron 500 
votantes al azar y se registraron los siguientes datos: 


Ciudad 
Opinión del votante Richmond Norfolk 
A favor de А 204 225 
A favor de B 211 198 
Indeciso 85 77 


А un nivel de significancia de 0.05 pruebe la hipótesis 
nula de que las proporciones de votantes que están a fa- 
vor del candidato A, a favor del candidato B o que están 
indecisos son las mismas para cada ciudad. 


10.96 En un estudio para estimar la proporción de 
esposas que de manera regular ven telenovelas se en- 
cuentra que 52 de 200 esposas en Denver, 31 de 150 en 
Phoenix y 37 de 150 en Rochester ven al menos una te- 
lenovela. Utilice un nivel de significancia de 0.05 para 
probar la hipótesis de que no hay diferencia entre las 
proporciones verdaderas de esposas que ven telenove- 
las en esas tres ciudades. 


funcionario actual para la próxima elección es de 
0.58. 

f) El filete rib-eye promedio en el restaurante Long- 
horn Steak pesa al menos 340 gramos. 


10.98 Un genetista se interesa en la proporción de 
hombres y mujeres de una población que tiene cierto 
trastorno sanguíneo menor. En una muestra aleatoria de 
100 hombres se encuentra que 31 lo padecen, mientras 
que sólo 24 de 100 mujeres analizadas tienen el tras- 
torno. Con un nivel de significancia de 0.01, ¿podemos 
concluir que la proporción de hombres en la población 
con este trastorno sanguíneo es significativamente ma- 
yor que la proporción de mujeres afectadas? 


10.99 Se realizó un estudio para determinar si un 
número mayor de italianos que de estadounidenses 
prefieren la champaña blanca en vez de la rosa para 


Ejercicios de repaso 


las bodas. De los 300 italianos que se seleccionaron al 
azar, 72 preferían champaña blanca, y de los 400 es- 
tadounidenses seleccionados, 70 preferían champaña 
blanca en vez de la rosa. ¿Podemos concluir que una 
proporción mayor de italianos que de estadounidenses 
prefiere champaña blanca en las bodas? Utilice un nivel 
de significancia de 0.05. 


10.100 Considere la situación del ejercicio 10.54 de 
la página 360. También se midió el consumo de oxí- 
geno en mL/kg/min. 


Sujeto Con CO Sin CO 
1 26.46 25.41 
2 17.46 22.93 
3 16.32 16.32 
4 20.19 27.48 
5 19.84 24.97 
6 20.65 21.77 
7 28.21 28.17 
8 33.94 32.02 
9 29.32 28.96 


Se supone que el consumo de oxígeno debería ser ma- 
yor en un ambiente relativamente libre de CO. Realice 
una prueba de significancia y analice la suposición. 


10.101 En un estudio realizado por el Centro de 
Consulta Estadística de Virginia Tech se solicitó a un 
grupo de sujetos realizar cierta tarea en la computa- 
dora. La respuesta que se midió fue el tiempo requerido 
para realizar la tarea. El propósito del experimento fue 
probar un grupo de herramientas de ayuda desarrolla- 
das por el Departamento de Ciencias Computacionales 
de la universidad. En el estudio participaron 10 sujetos. 
Con una asignación al azar, a 5 se les dio un proce- 
dimiento estándar usando lenguaje Fortran para reali- 
zar la tarea. A los otros 5 se les pidió realizar la tarea 
usando las herramientas de ayuda. А continuación se 
presentan los datos del tiempo requerido para comple- 
tar la tarea. 


Grupo 1 Grupo 2 
(procedimiento estándar) (herramienta de ayuda) 
161 132 
169 162 
174 134 
158 138 
163 133 


Suponga que las distribuciones de la población son 
normales y las varianzas son las mismas para los dos 
grupos y apoye o refute la conjetura de que las herra- 
mientas de ayuda aumentan la velocidad con la que se 
realiza la tarea. 
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10.102 Establezca las hipótesis nula y alternativa 
que usaría para probar las siguientes afirmaciones, y 
determine de manera general en dónde se localiza la 
región crítica: 

a) Alo sumo, 20% de la cosecha de trigo del próximo 
año se exportará a la Unión Soviética. 

b) En promedio, las amas de casa estadounidenses 
beben 3 tazas de café al día. 

c) La proporción de estudiantes que se graduaron 
este año en Virginia, especializados en ciencias 
sociales, es de al menos 0.15. 

d) El donativo promedio a la American Lung Asso- 
ciation no es mayor de 10 dólares. 

e) Los residentes de la zona suburbana de Richmond 
viajan en promedio 15 kilómetros para llegar a su 
lugar de trabajo. 


10.103 Si se selecciona al azar una lata que contiene 
500 nueces de cada uno de tres diferentes distribuido- 
res de nueces surtidas y cada lata contiene 345, 313 y 
359 cacahuates, respectivamente. Con un nivel de sig- 
nificancia de 0.01, ¿podríamos concluir que las nueces 
surtidas de los tres distribuidores contienen proporcio- 
nes iguales de cacahuates? 


10.104 Se realiza un estudio para determinar si hay 
una diferencia entre las proporciones de padres en los 
estados de Maryland (MD), Virginia (VA), Georgia 
(GA) y Alabama (AL) que están a favor de colocar 
Biblias en las escuelas primarias. En la siguiente tabla 
se registran las respuestas de 100 padres seleccionados 
al azar en cada uno de esos estados: 


Estado 
Preferencia MD VA GA AL 
Sí 65 71 78 82 
No 35 29 22 18 


¿Podemos concluir que las proporciones de padres que 
están a favor de colocar Biblias en las escuelas son 
iguales en esos cuatro estados? Utilice un nivel de sig- 
nificancia de 0.01. 


10.105 Se lleva a cabo un estudio en el Centro 
de Medicina Veterinaria Equina de la Universidad 
Regional de Virginia en Maryland para determinar si la 
realización de cierto tipo de cirugía en caballos jóvenes 
tiene algún efecto en ciertas clases de células sanguí- 
neas del animal. Se toman muestras del fluido de seis 
potros antes y después de la cirugía. En las muestras 
se analiza el número de leucocitos de glóbulos blancos 
(GB) después de la operación. También se midieron 
los leucocitos GB preoperatorios. Los datos son los 
siguientes: 
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Potro  Precirugía* Postcirugía* 
1 10.80 10.60 
2 12.90 16.60 
3 9.59 17.20 
4 8.81 14.00 
5 12.00 10.60 
6 6.07 8.60 


*Todos los valores x 10? 


Utilice una prueba ż de una muestra pareada para deter- 
minar si hay un cambio significativo en los leucocitos 
GB con la cirugía. 


10.106 El Departamento de Salud y Educación Física 
de Virginia Tech realizó un estudio para determinar si 
8 semanas de entrenamiento realmente reducen los 
niveles de colesterol de los participantes. A un grupo 
de tratamiento que consta de 15 personas se les dieron 
conferencias dos veces a la semana acerca de cómo re- 
ducir sus niveles de colesterol. Otro grupo de 18 per- 
sonas, de edad similar, fue seleccionado al azar como 
grupo de control. Se registraron los siguientes niveles 
de colesterol de todos los participantes al final del pro- 
grama de 8 semanas: 

Grupo con tratamiento: 


Tratamiento: 
129 131 154 172 115 126 175 191 
122 238 159 156 176 175 126 
Control: 
151 132 196 195 188 198 187 168 115 
165 137 208 133 217 191 193 140 146 


¿Podemos concluir, a un nivel de significancia del 5%, 
que el nivel de colesterol promedio se redujo gracias 
al programa? Haga la prueba adecuada en las medias. 


10.107 Enunestudio que llevó acabo el Departamento 
de Ingeniería Mecánica, el cual fue analizado por el 
Centro de Consulta Estadística del Virginia Tech, se 
compararon las varillas de acero distribuidas por dos 
empresas diferentes. Se fabricaron diez resortes de 
muestra con las varillas proporcionadas por cada em- 
presa y se estudió la “capacidad de rebote”. Los datos 
son los siguientes: 


Empresa A: 
9.38.8 6.8 8.7 8.5 6:7 8.0 65 9.270 
Empresa B: 
11...0:9..8 9.9 10.210.19.711.011.1 10.29.6 


¿Puede concluir que casi no hay diferencia en las me- 
dias entre las varillas de acero proporcionadas por las 
dos empresas? Utilice un valor P para llegar a su con- 
clusión. ¿Deberían agruparse las varianzas en este caso? 


10.108 En un estudio realizado por el Centro de 
Recursos Acuáticos, el cual fue analizado por el Centro 
de Consulta Estadística del Virginia Tech, se compa- 
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raron dos diferentes plantas de tratamiento para aguas 
residuales. La planta A se ubica en una zona donde el 
ingreso medio de los hogares está por abajo de $22,000 
al año, y la planta B se ubica en un lugar donde el in- 
greso medio de los hogares está por arriba de $60,000 
anuales. La cantidad de agua residual tratada en cada 
planta (miles de galones/día) se muestreó de forma 
aleatoria durante 10 días. Los datos son los siguientes: 


Planta A: 
21 19 20 23 22 28 32 19 13 18 


Planta В: 
20 39 24 33 30 28 30 22 33 24 


А un nivel de significancia de 5%, ¿podemos concluir 
que la cantidad promedio de agua residual tratada en la 
plantadel vecindario de altos ingresoses mayor que latra- 
tada en la planta del área de bajos ingresos? Suponga 
normalidad. 


10.109 Los siguientes datos muestran el número de 
defectos en 100,000 líneas de código en un tipo particu- 
lar de software hecho en Estados Unidos y en Japón. 
¿Hay suficiente evidencia para afirmar que existe una 
diferencia significativa entre los programas creados en 
los dos países? Pruebe las medias. ¿Se deberían agru- 
par las varianzas? 


Estados 48 39 42 52 40 48 52 52 
Unidos 54 48 52 55 43 46 48 52 
Japón 50 48 42 40 43 48 50 46 

38 38 36 40 40 48 48 45 


10.110 Existen estudios que muestran que la concen- 
tración de PCB es mucho más alta en tejido mamario 
maligno que en tejido mamario normal. Si un estudio 
de 50 mujeres con cáncer de mama revela una con- 
centración promedio de PCB de 22.8 х 107* gramos, 
con una desviación estándar de 4.8 х 10 gramos, ¿la 
concentración media de PCB es menor que 24 x 10+ 
gramos? 


10.111 Valor z para probar p,—p,=d,; Para probar 
la hipótesis nula H, de que p, — p, = 4„ donde d, # 0, 
basamos nuestra decisión en 


— Di — р — do 
vbiq/n + pp /n2 


que es un valor de una variable aleatoria cuya distri- 
bución se aproxima a la distribución normal estándar, 
siempre y cuando n, y л, sean grandes. Con respecto 
al ejemplo 10.11 de la página 364, pruebe la hipótesis 
de que el porcentaje de votantes de la ciudad que es- 
tán a favor de la construcción de la planta química no 
excederá en más de 3% al porcentaje de votantes del 
condado. Utilice un valor P en su conclusión. 


N 


10.15 Posibles riesgos y errores conceptuales; relación con el material de otros capítulos 387 


10.15 Posibles riesgos y errores conceptuales; relación con el material 
de otros capítulos 


Una de las formas más sencillas de darle un uso incorrecto a la estadística se refiere a la 
conclusión científica final que se obtiene cuando el analista no rechaza la hipótesis nula 
H, En este texto intentamos aclarar lo que significan la hipótesis nula y la alternativa, y 
también enfatizamos que, en general, la hipotesis alternativa es mucho más importante. A 
modo de ejemplo, si un ingeniero trata de comparar dos calibradores utilizando una prueba 
t de dos muestras, y H, afirma que “los calibradores son equivalentes”, mientras que H, 
afirma que “los calibradores no son equivalentes”, no rechazar H, no lo lleva a concluir que 
los calibradores son equivalentes. De hecho, ¡se puede dar el caso de que nunca se escriba 
o se diga “acepto Н”! El hecho de no rechazar Н, sólo implica que no existe evidencia 
suficiente. Según la naturaleza de la hipótesis, no se descartan aún muchas posibilidades. 

En el capítulo 9 consideramos el caso del intervalo de confianza para muestras gran- 
des utilizando _ 

xp 
s/yn' 

En la prueba de hipótesis es riesgoso reemplazar с con s рага n < 30. Sin > 30 y 
la distribución no es normal pero se acerca hasta cierto punto a la normal, se requiere 
el teorema del límite central y se confía en el hecho de que con п > 30, s = о. Desde 
luego, cualquier prueba т va acompañada por la suposición concomitante de normalidad. 
Сото en el caso de los intervalos de confianza, la prueba ѓ es relativamente robusta para 
la normalidad. Sin embargo, cuando la muestra no es demasiado pequeña es necesario 
utilizar gráficas de probabilidad normal, pruebas de bondad de ajuste u otros procedi- 
mientos gráficos. 

La mayoría de los capítulos de este texto incluyen análisis que tienen el propósito 
de relacionar el capítulo en cuestión con el siguiente material. Los temas de estimación 
y prueba de hipótesis se utilizan de manera importante en casi todas las técnicas que 
entran en el concepto de “métodos estadísticos”. Los estudiantes lo notarán fácilmente 
cuando avancen a los capítulos 11 a 16. Será evidente que esos capítulos dependen en 
gran medida de los modelos estadísticos. Los estudiantes se verán expuestos al uso de 
los modelos en una gran variedad de aplicaciones, en diversos campos científicos y de 
la ingeniería. Rápidamente se darán cuenta de que el esquema de un modelo estadístico 
es inútil a menos que se disponga de datos para estimar parámetros en el modelo formu- 
lado. Esto será especialmente evidente en los capítulos 11 y 12, cuando se presente el 
concepto de modelos de regresión. Seguiremos utilizando los conceptos y la teoría rela- 
cionados con el capítulo 9. En lo que se refiere al material de este capítulo, el esquema 
de la prueba de hipótesis, de los valores P, de la potencia de una prueba y la selección 
del tamaño de la muestra, en conjunto desempeñarán un papel importante. Dado que con 
mucha frecuencia la formulación del modelo inicial debe complementarse con la edición 
del mismo antes de que el analista se sienta lo suficientemente cómodo para utilizarlo 
con el fin de conocer o predecir un proceso, en los capítulos 11, 12 y 15 se utilizará con 
frecuencia la prueba de hipótesis para complementar las medidas diagnósticas que se 
emplean con el fin de evaluar la calidad del modelo. 


Capítulo 11 


Regresión lineal simple 
y correlación 


11.1 Introducción a la regresión lineal 


En la práctica a menudo se requiere resolver problemas que implican conjuntos de varia- 
bles de las cuales se sabe que tienen alguna relación inherente entre sí. Por ejemplo, en 
una situación industrial quizá se sepa que el contenido de alquitrán en el flujo de salida 
de un proceso químico está relacionado con la temperatura en la entrada. Podría ser de 
interés desarrollar un método de pronóstico, es decir, un procedimiento que permita es- 
timar el contenido de alquitrán para varios niveles de temperatura de entrada a partir de 
información experimental. Desde luego, es muy probable que para muchos ejemplos 
concretos en los que la temperatura de entrada sea la misma, por ejemplo 130*C, el con- 
tenido de alquitrán de salida no sea el mismo. Esto es muy similar a lo que ocurre cuando 
se estudian varios automóviles con un motor del mismo volumen; no todos tienen el 
mismo rendimiento de combustible. No todas las casas ubicadas en la misma zona 
del país, con la misma superficie de construcción, se venden al mismo precio. El conte- 
nido de alquitrán, el rendimiento del combustible (en millas por galón) y el precio de las 
casas (en miles de dólares) son variables dependientes naturales o respuestas en los tres 
escenarios. La temperatura en la entrada, el volumen del motor (pies cúbicos) y los me- 
tros cuadrados de superficie de construcción son, respectivamente, variables indepen- 
dientes naturales o regresores. Una forma razonable de relación entre la respuesta Y y 
el regresor x es la relación lineal, 


Y = 80 + Дх, 


en la que, por supuesto, 3, es la intersección y 3, es la pendiente. Esta relación se ilus- 
tra en la figura 11.1. 

Si la relación es exacta y no contiene ningún componente aleatorio o probabilístico, 
entonces se trata de una relación determinista entre dos variables científicas. Sin embargo, 
en los ejemplos que se mencionaron, así como en muchos otros fenómenos científicos y 
de ingeniería, la relación no es determinista, es decir, una x dada no siempre produce el 
mismo valor de Y. Como resultado, los problemas importantes en este caso son de natu- 
raleza probabilística, toda vez que la relación anterior no puede considerarse exacta. El 
concepto de análisis de regresión se refiere a encontrar la mejor relación entre Y y x 
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X 


Figura 11.1: Una relación lineal; 8,: intersección; 8: pendiente. 


cuantificando la fuerza de esa relación, y empleando métodos que permitan predecir los 
valores de la respuesta dados los valores del regresor x. 

En muchas aplicaciones habrá más de un regresor, es decir, más de una variable 
independiente que ayude a explicar a Y. Por ejemplo, si se tratara de explicar las razo- 
nes para el precio de una casa, se esperaría que una de ellas fuera su antigüedad, en cuyo 
caso la estructura múltiple de la regresión se podría escribir como 


Y = Bo + уху + х2, 


donde Y es el precio, x, son los metros cuadrados y x, es la antigüedad de la casa en años. 
En el capítulo siguiente se estudiarán problemas con regresores múltiples. El análisis 
resultante se denomina regresión múltiple; en tanto que el análisis del caso con un solo 
regresor recibe el nombre de regresión simple. En un segundo ejemplo de la regresión 
múltiple, un ingeniero químico podría estar interesado en la cantidad de hidrógeno que 
se ha perdido en las muestras de un metal específico que se tiene almacenado. En este 
caso habría dos entradas, x,, el tiempo de almacenamiento en horas, y x,, la temperatura 
de almacenamiento en grados centígrados. De modo que la respuesta sería Y, la pérdida de 
hidrógeno en partes por millón. 

En este capítulo estudiaremos el tema de la regresión lineal simple, que trata el 
caso de una sola variable regresora, en el que la relación entre x y y es lineal. Para el caso 
en el que hay más de una variable regresora el lector debe consultar el capítulo 12. De- 
notemos una muestra aleatoria de tamaño n mediante el conjunto ((x, y); i = 1, 2,..., п). 
Si se tomaran muestras adicionales utilizando exactamente los mismos valores de x, se 
esperaría que los valores de y variaran. Así, el valor y, en el par ordenado (х, у) es el 
valor de cierta variable aleatoria Y. 


11.2 El modelo de regresión lineal simple (RLS) 


Hemos limitado el uso del término análisis de regresión a los casos en los que las rela- 
ciones entre las variables no son deterministas, es decir, no son exactas. En otras pala- 
bras, debe existir un componente aleatorio en la ecuación que relaciona las variables. 
Este componente aleatorio toma en cuenta consideraciones que no son medibles o, de 
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hecho, que los científicos o los ingenieros no comprenden. En realidad, en la mayoría 
de aplicaciones de la regresión, la ecuación lineal, digamos, Y = 8, + 8х es una aproxi- 
mación que representa de manera simplificada algo desconocido y mucho más compli- 
cado. Por ejemplo, en el caso que implica la respuesta Y = contenido de alquitrán y x = 
temperatura de entrada es probable que Y = 8, + Вх sea una aproximación razonable 
que podría funcionar dentro de un rango limitado de x. La mayoría de las veces los mo- 
delos que son simplificaciones de estructuras más complicadas y desconocidas son de 
naturaleza lineal, es decir, lineales en los parámetros B, y B, o, en el caso del modelo 
que implica el precio, el tamaño y la antigüedad de la casa, lineal en los parámetros 8, 
B, y B, Estas estructuras lineales son sencillas y de naturaleza empírica, por lo que se 
denominan modelos empíricos. 

Un análisis de la relación entre x y Y requiere el planteamiento de un modelo esta- 
dístico. Con frecuencia un estadístico utiliza un modelo como representación de un 
ideal que, en esencia, define cómo percibimos que el sistema en cuestión generó los 
datos. El modelo debe incluir al conjunto ((x, y); i = 1, 2,..., п} de datos que implica n 
pares de valores (x, y). No debemos olvidar que el valor de y, depende de x, por medio de 
una estructura lineal que también incluye el componente aleatorio. La base para el uso 
de un modelo estadístico se relaciona con la manera en que la variable aleatoria Y cambia 
con x y el componente aleatorio. El modelo también incluye lo que se asume acerca de 
las propiedades estadísticas del componente aleatorio. A continuación se presenta el 
modelo estadístico para la regresión lineal simple. La respuesta Y se relaciona con la 
variable independiente x a través de la ecuación 


Modelo de 
regresión lineal 
simple 


Y = 8 + Bix + є. 


еп la cual 8, у 8, son los parámetros desconocidos de la intersección y la pendiente, 
respectivamente, y € es una variable aleatoria que se supone está distribuida con Е(є) = 0 
y Маг(є) = o”. Es frecuente que a la cantidad о? se le denomine varianza del error o 
varianza residual. 

En el modelo anterior hay varias cuestiones evidentes. La cantidad Y es una variable 
aleatoria, ya que e es aleatoria. El valor x de la variable regresora no es aleatorio y, de 
hecho, se mide con un error despreciable. La cantidad €, que a menudo recibe el nombre 
de error aleatorio o alteración aleatoria, tiene varianza constante. Es común que a esta 
parte se le denomine suposición de varianza homogénea. La presencia de este error 
aleatorio € evita que el modelo se convierta tan sólo en una ecuación determinista. Aho- 
га, el hecho de que Е(є) = 0 implica que para una x específica, los valores de y se distri- 
buyen alrededor de la recta verdadera o recta de regresión de la población y = 8, + 
Вх. Si se elige bien el modelo, es decir, si no hay otros regresores de importancia y la 
aproximación lineal es buena dentro de los rangos de los datos, entonces son razonables 
los errores positivos y negativos que rodean a la regresión verdadera. Debe recordarse 
que en la práctica 8, y 8, se desconocen y que deben estimarse a partir de los datos. 
Además, el modelo que se acaba de describir es de naturaleza conceptual. Como resul- 
tado, en la práctica nunca se observan los valores € reales, por lo que nunca se puede 
trazar la verdadera recta de regresión, aunque suponemos que ahí está. Sólo es posible 
dibujar una recta estimada. En la figura 11.2 se ilustra la naturaleza de los datos (x, y) 
hipotéticos dispersos alrededor de la verdadera recta de regresión para un caso en que 
sólo se dispone de n = 5 observaciones. Debemos destacar que lo que observamos en la 
figura 11.2 no es la recta que utilizan el científico o ingeniero. En vez de esa recta, ¡lo 


392 Capítulo 11 Regresión lineal simple y correlación 


que describe la ilustración es el significado de las suposiciones! Ahora describiremos la 
regresión que el usuario tiene a su disposición. 


E Es 


E E3 


Es 


“Verdadera” recta de regresión 


EV) =® + б\х 


х 


Figura 11.2: Datos (x, y) hipotéticos dispersos alrededor de la verdadera recta de 
regresión para n = 5. 


La recta de regresión ajustada 


Un aspecto importante del análisis de regresión es, en términos sencillos, estimar los 
parámetros 8, y [,, es decir, estimar los llamados coeficientes de regresión. En la sec- 
ción siguiente se estudiará el método para estimarlos. Suponga que denotamos los esti- 
mados b, para 8, y b, para 8. Entonces, la recta de regresión ajustada, o estimada, es 
dada por 


5 = ро + х, 


donde Ў es el valor pronosticado o ajustado. Es evidente que la recta ajustada es un esti- 
mado de la verdadera recta de regresión. Se espera que la recta ajustada esté más cerca 
de la verdadera línea de regresión cuando se dispone de una gran cantidad de datos. En 
el ejemplo siguiente se ilustra la recta ajustada para un estudio sobre contaminación 
en la vida real. 

Uno de los problemas más desafiantes que enfrenta el campo del control de la con- 
taminación del agua lo representa la industria de la peletería, ya que sus desechos son 
químicamente complejos; se caracterizan por valores elevados de la demanda de oxíge- 
no químico, sólidos volátiles y otras medidas de contaminación. Considere los datos 
experimentales de la tabla 11.1, que se obtuvieron de 33 muestras de desechos tratados 
químicamente en un estudio realizado en Virginia Tech. Se registraron los valores de x, 
la reducción porcentual de los sólidos totales, y de y, el porcentaje de disminución de la 
demanda de oxígeno químico. 

Los datos de la tabla 11.1 aparecen graficados en un diagrama de dispersión en la 
figura 11.3. Al inspeccionar dicho diagrama se observa que los puntos se acercan mucho 
a una línea recta, lo cual indica que la suposición de linealidad entre las dos variables 
parece ser razonable. 
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Tabla 11.1: Medidas de la reducción de los sólidos y de la demanda de oxígeno químico 


Reducción Reducción de la demanda Reducción Reducción de la demanda 
de sólidos, х (%) de oxígeno, y (%) de sólidos, х (%) de oxígeno, y (%) 

3 5 36 34 
7 11 37 36 

11 21 38 38 

15 16 39 37 

18 16 39 36 

21 28 39 45 

29 27 40 39 

30 25 41 41 

30 35 42 40 

31 30 42 44 

31 40 43 37 

32 32 44 44 

33 34 45 46 

33 32 46 46 

34 34 47 49 

36 37 50 51 

36 38 


O 3 6 9 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54 


Figura 11.3: Diagrama de dispersión con rectas de regresión. 


En el diagrama de dispersión de la figura 11.3 se ilustra la recta de regresión ajusta- 
da y una recta hipotética de regresión verdadera. Más adelante, en la sección 11.3, en la 
cual estudiaremos el método de estimación, revisaremos este ejemplo. 
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Otra mirada a las suposiciones del modelo 


Resulta aleccionador repasar el modelo de regresión lineal simple que se presentó con 
anterioridad y analizar de forma gráfica la manera en que se relaciona con la denomina- 
da regresión verdadera. Daremos más detalles en la figura 11.2, cuando ilustremos no 
sólo el lugar en que los e, se localizan en la gráfica, sino también lo que implica la supo- 
sición de normalidad para los є. 

Suponga que tenemos una regresión lineal simple con n = 6, valores de x equidis- 
tantes y un valor único de y para cada x. Considere la gráfica de la figura 11.4, la cual 
debería proporcionar al lector una representación clara del modelo y de las suposiciones 
implicadas. La recta que aparece en la gráfica es la recta de regresión verdadera. Los 
puntos graficados (у, x) son puntos reales dispersos alrededor de la recta. Cada punto se 
ubica en su propia distribución normal, donde el centro de la distribución, es decir, la 
media de y, cae sobre la recta. Ciertamente esto es lo esperado, ya que E(Y) = B, + Вх. 
Como resultado, la verdadera recta de regresión pasa a través de las medias de la res- 
puesta y las observaciones reales se encuentran sobre la distribución, alrededor de las 
medias. Observe también que todas las distribuciones tienen la misma varianza, que se 
denota con o°. Desde luego, la desviación entre una y individual y el punto sobre la 
recta será su valor individual e. Esto queda claro porque 


у = Е(Ү;) = у; — (Во + бух) = є. 


Así, con una х dada, tanto Y como el є correspondiente tienen varianza o°. 


X 
Figura 11.4: Observaciones individuales alrededor de la verdadera recta de regresión. 


Note también que aquí escribimos la verdadera recta de regresión como My = P,+8,x 
con el fin de reafirmar que la recta pasa a través de la media de la variable aleatoria Y. 


11.3 Mínimos cuadrados y el modelo ajustado 


En esta sección se estudia el método para ajustar una recta de regresión estimada a los 
datos, lo cual equivale a determinar los estimados b, para 6, y b, para 8,. Por supuesto, 
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esto permite el cálculo de los valores pronosticados a partir de la recta ajustada ӯ = b, 
+ b,x, y otros tipos de análisis y de información diagnóstica que determinarán la fuerza 
de la relación, así como la adecuación y el ajuste del modelo. Antes de analizar el mé- 
todo de estimación de los mínimos cuadrados es importante presentar el concepto de 
residual. En esencia, un residual es un error en el ajuste del modelo у = b, + b,x. 


Residual: Error Dado un conjunto de datos de regresión {(х„ y); i = 1, 2,..., п} y un modelo ajustado 
en el ajuste у, = b, + b,x, el i-ésimo residual e, es dado por 


ei = yi — Îi, TS E2 


Es evidente que si un conjunto de n residuales es grande, entonces el ajuste del mo- 
delo no es bueno. Los residuales pequeños son indicadores de un ajuste adecuado. Otra 
relación interesante, y que a veces es útil, es la siguiente: 


yi = bo + рух; + ei. 


El uso de la ecuación anterior debería aclarar la diferencia entre los residuales e, y los 
errores del modelo conceptual є. No debemos olvidar que, mientras que los €, no se 
observan, los e, no sólo se observan sino que desempeñan un papel importante en el 
análisis total. 

La figura 11.5 ilustra el ajuste de la recta a este conjunto de datos: a saber Ў = b, + 
b x, y la recta que refleja el modelo Hy, = B,+B,x. Desde luego, 8, y В, son parámetros 
desconocidos. La recta ajustada es un estimado de la recta que genera el modelo estadís- 
tico. Hay que tener presente que la recta Шу В, +68,х es desconocida. 


* 
= 
<> 

Ш 


bo+b,x 


Hylx =Bo+B1x 


Figura 11.5: Comparación de €, con el residual е. 


Método de mínimos cuadrados 


Debemos calcular b, y b,, los estimados de 8, y B,, de manera que la suma de los cua- 
drados de los residuales sea mínima. La suma residual de los cuadrados con frecuencia 
se denomina suma de los cuadrados del error respecto de la recta de regresión y se 
denota como SCE. Este procedimiento de minimización para estimar los parámetros 


Capítulo 11 Regresión lineal simple y correlación 


396 
se denomina método de mínimos cuadrados. Por lo tanto, debemos calcular a y b para 
minimizar 


SCE = Уе = Уо: – ў) = So: = bo— Бух)”. 
¡=1 ¡=1 ¡=1 


Al diferenciar la SCE con respecto a р, y b,, se obtiene 


O(SCE) ч O(SCE) = 
—— = -2 i — bọ — bixi), — ñ_——=-2 і — ро — bixi )xi. 
Ib, 20 o— bixi) EA 20 o —bixj¡)x 
Al igualar a cero las derivadas parciales y reacomodar los términos, obtenemos las ecua- 


ciones siguientes (llamadas ecuaciones normales) 


n п п п п 
nbo + у х= у у. bo DY xi +b у ху = Уху, 
ї=1 i=1 ї=1 i=l і=1 


que se resuelven simultáneamente para obtener fórmulas de cálculo para b, y b.. 


Estimación de los Dada la muestra ((x, у)}; i = 1, 2, ..., n}, los estimados b, y b, de los mínimos cuadra- 
coeficientes dos de los coeficientes de regresión 6, y 8, se calculan mediante las fórmulas 


de regresión А Я к А 
п Узия (Lx) (Ey) Y — 01 —Y) 
і=1 i i i=l 
= n y 


zı) Y (e 2) 
1 i=1 


Ьу = 
па? ( 


bo= 
п 


En el ejemplo siguiente se ilustra el cálculo de b, y b, usando los datos de la tabla 11.1. 


Ejemplo 11.1: | Estime la recta de regresión para los datos de contaminación de la tabla 11.1. 


Solución: 33 33 33 33 
Y x; =1104, Y y; = 1124, Уху = 41,355, Y x? = 41,086 
i=l i=l i=l i=l 


Por lo tanto, 
41 — (110401124 
к A i y 


bi = 
(33)(41,086)—(1104)2 
1124 — (0.903643)(1104 
bo = . 2 a = 3.829633. 
33 
Por consiguiente, la recta de regresión estimada es dada por 
J 


ӯ = 3.8296 + 0.9036x. 


Si utilizáramos la recta de regresión del ejemplo 11.1, podríamos pronosticar una 
reducción de 31% en la demanda de oxígeno químico si los sólidos totales se redujeran 
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un 30%. La reducción de 31% en la demanda de oxígeno químico se puede interpretar 
como un estimado de la media de la población Hygo O COMO UN estimado de una obser- 
vación nueva si la reducción de sólidos totales es de 30%. Sin embargo, dichas estima- 
ciones están sujetas a error. Incluso si el experimento estuviera controlado para que la 
reducción de los sólidos totales fuera de 30%, es improbable que la reducción en la de- 
manda de oxígeno químico que se midiera fuera exactamente igual a 31%. De hecho, los 
datos originales registrados en la tabla 11.1 indican que se registraron medidas de 25% 
y de 35% en la reducción de la demanda de oxígeno, cuando la disminución de los sóli- 
dos totales se mantuvo en 30%. 


¿Qué es lo bueno de los mínimos cuadrados? 


Debemos señalar que el criterio de los mínimos cuadrados está diseñado para brindar 
una recta ajustada que resulte en la “cercanía” entre la recta y los puntos graficados. 
Existen muchas formas de medir dicha cercanía. Por ejemplo, quizá desearíamos de- 


п 
terminar los valores de b, у b, para los que se minimiza З ly; = Ў:| о para los que se 


n = 
minimiza У) |y; – 3: |1. Ambos métodos son viables y razonables. Observe que los dos, 
¡=1 
así como el procedimiento de mínimos cuadrados, obligan a que los residuales sean “ре- 
queños” en cierto sentido. Debemos recordar que los residuales son el equivalente empí- 
rico de los valores de €. La figura 11.6 ilustra un conjunto de residuales. Observe que la 
línea ajustada tiene valores predichos como puntos sobre la recta y, en consecuencia, los 
residuales son desviaciones verticales desde los puntos hasta la recta. Como resultado, el 
procedimiento de mínimos cuadrados genera una recta que minimiza la suma de los 
cuadrados de las desviaciones verticales desde los puntos hasta la recta. 


Figura 11.6: Los residuales como desviaciones verticales. 
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Ejercicios 

11.1 Se realizó un estudio en Virginia Tech para de- 
terminar si ciertas medidas de la fuerza estática del bra- 
zo influyen en las características de “levantamiento 
dinámico” de un individuo. Veinticinco individuos se 
sometieron a pruebas de fuerza y luego se les pidió que 
hicieran una prueba de levantamiento de peso, en el 
que el peso se elevaba en forma dinámica por encima 
de la cabeza. A continuación se presentan los datos. 


‚2. Fuerza Levantamiento 
Individual ды brazo,x dinámico, y 
1 17.3 717 
2 19.3 48.3 
3 19.5 88.3 
4 19.7 75.0 
5 22.9 91.7 
6 23.1 100.0 
7 26.4 73.3 
8 26.8 65.0 
9 27.6 75.0 
10 28.1 88.3 
11 28.2 68.3 
12 28.7 96.7 
13 29.0 76.7 
14 29.6 78.3 
15 29.9 60.0 
16 29.9 71.7 
17 30.3 85.0 
18 31.3 85.0 
19 36.0 88.3 
20 39.5 100.0 
21 40.4 100.0 
22 44.3 100.0 
23 44.6 91.7 
24 50.4 100.0 
25 55.9 717 


a) Estime los valores de 8, y 8, para la curva de re- 
gresión lineal My = P,+B,x. 
b) Calcule un estimado puntual de Bso" 
c) Grafique los residuales en comparación con las x 
(fuerza del brazo). Comente los resultados. 
11.2 Las siguientes son las calificaciones de un grupo 
de 9 estudiantes en un informe de medio semestre (x) y 
en el examen final (y): 
x | 77 50 71 72 81 94 96 99 67 
y | 82 66 78 34 47 85 99 99 68 


a) Estime la recta de regresión lineal. 

b) Calcule la calificación final de un estudiante que 
obtuvo 85 de calificación en el informe de medio 
semestre. 

11.3 Se registraron las cantidades de un compuesto 
químico y que se disuelve en 100 gramos de agua a 
distintas temperaturas x: 
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х (°С) | y (gramos) 
0 8 6 8 
15 12 10 14 
30 25 21 24 
45 31 33 28 
60 44 39 42 
75 48 51 44 


a) Calcule la ecuación de la recta de regresión. 

b) Grafique la recta en un diagrama de dispersión. 

c) Estime la cantidad de producto químico que se di- 

solverá en 100 gramos de agua a 50°С. 

11.4 Para fines de calibración se recabaron los si- 
guientes datos, los cuales permitirían determinar la re- 
lación entre la presión y la lectura correspondiente en 
la escala. 


Presión, x (Ib/pulg?) Lectura en la escala, y 
10 13 
10 18 
10 16 
10 15 
10 20 
50 86 
50 90 
50 88 
50 88 
50 92 


a) Calcule la ecuación de la recta de regresión. 

b) En esta aplicación el propósito de la calibración es 
estimar la presión a partir de una lectura observada 
en la escala. Estime la presión para una lectura en 
la escala de 54, usando ê = (54 — b,)/b.. 

11.5 Se realizó un estudio sobre la cantidad de azúcar 

convertida en cierto proceso a distintas temperaturas. 

Los datos se codificaron y registraron como sigue: 
Temperatura, x Azúcar convertida, y 


1.0 8.1 
1.1 7.8 
1.2 8.5 
1.3 9.8 
1.4 9.5 
1:5 8.9 
1:6 8.6 
1.7 10.2 
1.8 9:3 
1.9 9.2 
2.0 10.5 


а) Estime la recta de regresión lineal. 

b) Calcule la cantidad media de azúcar convertida 
que se produce cuando se registra una temperatura 
codificada de 1.75. 

с) Grafique los residuales en comparación con la 
temperatura. Comente sus resultados. 
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11.6 En cierto tipo de espécimen de prueba metálico 
se sabe que la tensión normal sobre un espécimen se 
relaciona funcionalmente con la resistencia al corte. El 
siguiente es un conjunto de datos experimentales codi- 
ficados para las dos variables: 

Tensión normal, x Resistencia al corte, у 


26.8 26.5 
25.4 27.3 
28.9 24.2 
23.6 27.1 
27.7 23.6 
23.9 25.9 
24.7 26.3 
28.1 22.5 
26.9 21.7 
27.4 21.4 
22.6 25.8 
25.6 24.9 


a) Estime la recta de regresión р, = B, + Вх. 
b) Estime la resistencia al corte para una tensión nor- 
mal de 24.5. 


11.7 Los siguientes son algunos de los datos conteni- 
dos en un conjunto clásico denominado “datos piloto 
de graficación” que aparecen en Fitting Equations to 
Data, de Daniel y Wood, publicado en 1971. La res- 
puesta y es el contenido de ácido del material determi- 
nado por análisis volumétrico; mientras que el regresor 
x es el contenido de ácido orgánico determinado por 
extracción y ponderación. 

y x | y x 

76 123 70 

62 55 37 48 


66 100 82 138 
58 75 88 164 
88 159 43 28 


a) Grafique los datos; ¿la regresión lineal simple pa- 
rece un modelo adecuado? 

b) Haga un ajuste de regresión lineal simple; calcule 
la pendiente y la intersección. 

c) Grafique la recta de regresión en la gráfica del in- 
ciso a. 


11.8 Se aplica un examen de colocación de matemá- 
ticas a todos los estudiantes de nuevo ingreso en una 
universidad pequeña. Se negará la inscripción al curso 
regular de matemáticas a los estudiantes que obtengan 
menos de 35 puntos y se les enviará a clases de regula- 
rización. Se registraron los resultados del examen de 
colocación y las calificaciones finales de 20 estudiantes 
que tomaron el curso regular: 

a) Elabore un diagrama de dispersión. 

b) Calcule la ecuación de la recta de regresión para 
predecir las calificaciones en el curso a partir de 
las del examen de colocación. 

c) Grafique la recta en el diagrama de dispersión. 
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d) Si la calificación aprobatoria mínima fuera 60 
puntos, ¿qué calificación en el examen de coloca- 
ción se debería usar en el futuro como criterio para 
negar a los estudiantes el derecho de admisión a 


ese curso? 
Examen Calificación 
de colocación en el curso 
50 53 
35 41 
35 61 
40 56 
55 68 
65 36 
35 11 
60 70 
90 79 
35 59 
90 54 
80 91 
60 48 
60 71 
60 71 
40 47 
55 53 
50 68 
65 57 
50 79 


11.9 Un comerciante minorista realizó un estudio 
para determinar la relación que hay entre los gastos se- 
manales de publicidad y las ventas. 


Costos de publicidad ($) Ventas ($) 
40 385 
20 400 
25 395 
20 365 
30 475 
50 440 
40 490 
20 420 
50 560 
40 525 
25 480 
50 510 


a) Elabore un diagrama de dispersión. 

b) Calcule la ecuación de la recta de regresión para 
pronosticar las ventas semanales a partir de los 
gastos de publicidad. 

c) Estime las ventas semanales si los costos de publi- 
cidad son de $35. 

d) Grafique los residuales en comparación con los 
costos de publicidad. Comente sus resultados. 
11.10 Los siguientes datos son los precios de venta z 
de cierta marca y modelo de automóvil usado con w 
años de antigüedad. Ajuste una curva de la forma 
Hyw ё" mediante la ecuación de regresión muestral 
no lineal 2 = са" [Sugerencia: Escriba ln 2 = ln c + 

(In d)w = b, + bw]. 
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w (años) z (dólares) |w (años) z (dólares) 
1 6350 3 5395 
2 5695 5 4985 
2 5750 5 4895 


11.11 La fuerza de impulso de un motor (y) es una 
función de la temperatura de escape (x) en °Е cuando 
otras variables de importancia se mantienen constantes. 
Considere los siguientes datos. 


y x | y x 
4300 1760 | 4010 1665 
4650 1652 | 3810 1550 
3200 1485 | 4500 1700 
3150 1390 | 3008 1270 
4950 1820 


a) Grafique los datos. 
b) Ajuste una recta de regresión simple a los datos y 
grafíquela a través de ellos. 


11.12 Se realizó un estudio para analizar el efecto de 
la temperatura ambiente x sobre la energía eléctrica 
consumida por una planta química y. Otros factores se 
mantuvieron constantes y se recabaron los datos de una 
planta piloto experimental. 


у BTU) x CF) |y BTU)  _x CF) 
250 27 265 31 
285 45 298 60 
320 72 267 34 
295 58 321 74 


a) Grafique los datos. 

b) Estime la pendiente y la intersección en un modelo 
de regresión lineal simple. 

c) Pronostique el consumo de energía para una tem- 
peratura ambiente de 65°Е. 
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11.13 Un estudio sobre la cantidad de lluvia y la de 
contaminación del aire eliminada produjo los siguien- 
tes datos: 

Cantidad de lluvia Partículas eliminadas, 


diaria, x (0.01 cm) y (pg/m?) 
43 126 
4.5 121 
5.9 116 
5.6 118 
6.1 114 
5.2 118 
3.8 132 
21 141 
7.5 108 


a) Calcule la ecuación de la recta de regresión para 
predecir las partículas eliminadas de la cantidad 
de precipitación diaria. 

b) Estime la cantidad de partículas eliminadas si la 
precipitación diaria es x = 4.8 unidades. 


11.14 Un profesor de la Escuela de Negocios de una 
universidad encuestó a una docena de colegas acerca 
del número de reuniones profesionales a que acudieron 
en los últimos cinco años (x) y el número de trabajos 
que enviaron a revistas especializadas (y) durante el 
mismo periodo. A continuación se presenta el resumen 
de los datos: 
п= 12, x=4 y=12 


Nu? =232, уху =318. 
i=l 


i=l 
Ajuste un modelo de regresión lineal simple entre x y y 
calculando los estimados de la intersección y la pendien- 
te. Comente si la asistencia a más reuniones profesiona- 
les da como resultado más publicaciones de artículos. 


11.4 Propiedades de los estimadores de mínimos cuadrados 


Además de los supuestos de que el término del error en el modelo 

Y; = Во + Вх; + 
es una variable aleatoria con media igual а cero y varianza о? constante, suponga que 
además damos por hecho que є, €,,..., є, son independientes de una corrida a otra del 
experimento, lo cual proporciona la base para calcular las medias y varianzas de los es- 
timadores de 6, y B.. 

Es importante recordar que nuestros valores de b, y b,, basados en una muestra dada 
de n observaciones, sólo son estimaciones de los parámetros verdaderos 6, y 8|. Si el 
experimento se repitiera una y otra vez, usando en cada ocasión los mismos valores fijos 
de x, los estimados resultantes de 8, y 6, muy probablemente diferirían de un experi- 
mento a otro. Estos estimados distintos podrían ser considerados como valores adoptados 
por las variables aleatorias В, y В; en tanto que b, y b, son ejecuciones específicas. 

Como los valores de x permanecen fijos, los valores de B, y B, dependen de las va- 
riaciones en los valores de y o, con más precisión, en los valores de las variables aleatorias 
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Y, Y,,..., Y, Las suposiciones sobre la distribución implican que las Y, i = 1, 2,..., п 
también están distribuidas de manera independiente, con media Hy jx, = Bo + ixi y 
varianzas 0? iguales, es decir, 


20 _ 
Сү |, =0% рага і= 1, 2,...,п. 


Media y varianza de los estimadores 


En la exposición que sigue mostramos que el estimador B, es insesgado para 8, y se 
demuestran tanto las varianzas de В, como las de В. Esto inicia una serie de procedi- 
mientos que conducen a la prueba de hipótesis y a la estimación de intervalos de confianza 
para la intersección y la pendiente. 

Como el estimador 


DOI EN 


В| = n п 

у Оа гаи) 
[=1 i=l 

n 

es de la forma У? c;Y;, 
i=l 
Xi — xX А 
c = ———, 1252 

Уу (Жу ==) 
i=l 


podemos concluir a partir del teorema 7.11 que В, tiene una distribución п(Ив„ Og,) con 


Sii — *)(80 + 81х;) У 
= = 


(х — *)?ю, 
1 _ O 


DAR Е 
Е y o? 
Eco] к= 


2 


1 


Ив, Е =@ уо» = 


DAR 
i=l 


También se puede demostrar (véase el ejercicio de repaso 11.60 de la página 438) 
que la variable aleatoria B, se distribuye normalmente con 


n 


2 
Xi 


1 2 


2 i 

= С, 
nd le —Х)? 

isl 


media ив, = Во y varianza Oz, = 


A partir de estos resultados es evidente que los estimadores de mínimos cuadrados 
tanto рага 8, como para [8, son insesgados. 


Partición de la variabilidad total y estimación de с? 


Para hacer inferencias sobre 6, y б, es necesario llegar a una estimación del parámetro 
о? que aparece en las dos fórmulas anteriores de la varianza de B, y B,. El parámetro 0”, 
el modelo de la varianza del error, refleja una variación aleatoria o una variación del 
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error experimental alrededor de la recta de regresión. En gran parte de lo que sigue se 


recomienda emplear la notación 
n п 


Se = у 0-20), Sy = 0-9, Sy = у (х.—Х)(ур—ў). 


ї=1 ї=1 i=l 


De manera que la suma de los cuadrados del error se puede escribir como sigue: 


SCE = Sy: — bọ bx) = Уо = 9) -bQ – #)р 


isl i=1 


= Y 0: – 9)? —2b1 У (х: – DO 9) + РУ a Y? 
і=1 і=1 і=1 
= S yy = 2b18 yy F biS = Syy – S ху, 
que es el paso final que surge del hecho de que р = S yy /Sxx. 


Teorema 11.1: Un estimador insesgado de с? es 


n 


SCE (у; – $;)2 S ; — bi Sw 
ZE D . YY n 


== = 
п—2 г 


п = 2 п = 2 


La prueba del teorema 11.1 se deja como ejercicio (véase el ejercicio de repaso 11.59). 


El estimador de т? como error cuadrado medio 


Para darnos una idea del estimador de о? deberíamos observar el resultado del teorema 
11.1. El parámetro о? mide la varianza o las desviaciones cuadradas entre los valores de 
Y y su media, dada por Hy y es decir, las desviaciones cuadradas entre Y y 8, + 8,х. Por 
supuesto, 3, + B,x se estima por medio de $ = b, + b,x. Por consiguiente, tendría sen- 
tido que la varianza о? se describa mejor сото una desviación cuadrada de la observa- 
ción típica y, con respecto a la media estimada у , que es el punto correspondiente sobre 
la recta ajustada. Entonces, los valores (у, — 3) revelan la varianza apropiada, de mane- 
ra muy similar a como los valores (у, — у)? miden la varianza cuando se realiza un 
muestreo en un escenario no relacionado con la regresión. En otras palabras, y estima la 
media en la última situación sencilla, mientras que у, estima la media de y, en una estruc- 
tura de regresión. Ahora, ¿qué significa el divisor n — 2? En las secciones que siguen 
observaremos que éstos son los grados de libertad asociados con el estimador s? de o°. 
En tanto que en el escenario i.i.d. (independiente e idénticamente distribuidas), la normal 
estándar se resta un grado de libertad de n en el denominador, para lo cual una explica- 
ción razonable es que se estima un parámetro, que es la media u por medio de, digamos, 
y, pero en el problema de la regresión se estiman dos parámetros, que son 6, y 8,, por 
medio de b, y b,. Así, el parámetro importante O”, que se estima mediante 


52 = Yo =$ /(n — 2), 
¡=1 


se denomina error cuadrado medio, que describe un tipo de media (división entre n — 2) 
de los residuales cuadrados. 
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11.5 Inferencias sobre los coeficientes de regresión 


Además de tan sólo estimar la relación lineal entre x y Y para fines de predicción, el ex- 
perimentador podría estar interesado en hacer ciertas inferencias acerca de la pendiente 
y la intersección. Para dar ocasión a la prueba de hipótesis y a la construcción de inter- 
valos de confianza para 8, y 8,, debemos estar dispuestos a hacer la suposición adicional 
de que cada €, i = 1,2, ..., n, se distribuye de forma normal. Esta suposición implica que 
Ypo Vys Т. también están =- normalmente, cada una con una distribución de 
probabilidad п(у; В, + Вх p O 

A partir de la sección 11. | sabemos que B, tiene una distribución normal, у supo- 
niendo normalidad, un resultado muy parecido al que se plantea en el teorema 8.4 nos 
permite concluir que (n — 2)5?/0? es una variable chi cuadrada con n — 2 grados de 
libertad, independiente de la variable aleatoria B,. Entonces, el teorema 8.5 garantiza que 
el estadístico 


(В, – В) /(9/ү5,) _ Bı – 8 
S/o $/ VS xx 


tenga una distribución £ con n — 2 grados de libertad. Podemos utilizar el estadístico Т 
para construir un intervalo de confianza del 100(1 — 0)% para el coeficiente 8. 


T = 


Intervalo de 
confianza рага 6, 


Un intervalo de confianza de 100(1 – 4)% para el parámetro 6, en la recta de regresión 


Ш. = В, + бух gs 


bi — taj2 = < В < bi Баро == 


S XX Ку Хх 


donde 1 j es un valor de la distribución ѓ con n — 2 grados de libertad. 


Ejemplo 11.2: | Calcule un intervalo de confianza de 95% рага 6, en la recta de regresión Hy = = 8, + 


Solución: 


Өх, con base en los datos de contaminación de la tabla 11.1. 


A partir de los resultados dados en el ejemplo 11.1, se determina que 5 = 4152.18 y 
5, = 3752.09. Además, se observa que 5, = 3713.88. Recuerde que b, = "0.903643. En 
consecuencia, 


E Syy — ДЕ = 3713.88 — LAA — 10.4299. 
n= 


Por lo tanto, al sacar la raíz cuadrada obtenemos s = 3.2295. Si usamos la tabla A.4 en- 
contramos que f, p; = 2.045 para 31 grados de libertad. Así, un intervalo de confianza de 
95% рага 6, es 


(2.045)(3 .2295) (2.045)(3.2295) 


< B < 0.903643 + 
y4152.18 А №4152.18 


0.903643 — 


que se simplifica a 


0.8012 < 8; < 1.0061. 3 
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Prueba de hipótesis sobre la pendiente 


Para probar la hipótesis nula A, de que 6, = 6, en comparación con una alternativa 
posible, utilizamos de nuevo la distribución ѓ con n — 2 grados de libertad con el fin de 
establecer una región crítica y después basar nuestra decisión en el valor de 


_ bi = Во 


t = ——=. 
SINS хх 


El método se ilustra con el ejemplo siguiente. 


Ejemplo 11.3: | Utilice el valor estimado b, = 0.903643 del ejemplo 11.1 y pruebe la hipótesis de que 
В, = 1.0 en comparación con la alternativa de que 8, < 1.0. 
Solución: Las hipótesis son Н: 8, = 1.0 y A: 8, < 1.0. Por lo tanto, 


= 0.903643 — 1.0 _ 
3.2295 /4/4152.18 


con п — 2 = 31 grados de libertad (Р = 0.03). 

Decisión: El valor г es significativo al nivel 0.03, lo cual sugiere evidencia sólida de 
que 8, < 1.0. 

Una prueba т importante sobre la pendiente es la prueba de la hipótesis 


1.92, 


Ho: Bı = 0 en comparación соп Hı: 8; +40. 


Cuando no se rechaza la hipótesis nula la conclusión es que no hay relación lineal signi- 
ficativa entre E(y) y la variable independiente х. La gráfica de los datos del ejemplo 11.1 
sugeriría que existe una relación lineal. Sin embargo, en ciertas aplicaciones en las que 
а? es grande y, por ende, hay “ruido” considerable en los datos, una gráfica, aunque útil, 
quizá no produzca información clara para el investigador. El rechazo anterior de A, im- 
plica que hay una relación lineal significativa. 

La figura 11.7 muestra la salida de resultados de MINITAB que presenta la prueba 
ї para 


Ho: В = 0 en comparación con Hı: 8. 40, 


para los datos del ejemplo 11.1. Observe el coeficiente de regresión (Coef), el error es- 
tándar (EE Coef), el valor t (T) y el valor Р (P). Se rechaza la hipótesis nula. Es claro que 
existe una relación lineal significativa entre la reducción de la demanda media del oxíge- 
no químico y la reducción de los sólidos. Observe que el estadístico / se calcula como 


coeficiente bi 
error estándar _ s/ V/S 


El no rechazo de Н: 8, = 0 sugiere que no hay una relación lineal entre Y y x. La 
figura 11.8 es una ilustración de la implicación de este resultado; podría significar que 
los cambios de x tienen poco efecto sobre los cambios de Y, como se ve en el inciso a. 
Sin embargo, también puede indicar que la relación verdadera es no lineal, como se 
aprecia en b. 

Cuando se rechaza Н: 8, = 0 existe la implicación de que el término lineal en x que 
reside en el modelo explica una parte significativa de la variabilidad de Y. Las dos gráfi- 
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Regression Analysis: COD versus Рег Red 


The regression equation is COD = 3.83 + 0.904 Per Red 


Predictor Coef SE Coef T Р 

Constant 3.830 1.768 2.17 0.038 

Рег Кеа 0.90364 0.05012 18.03 0.000 

S = 3.22954 R-Bq = 91.36 R-Sgladj ) = 91.0% 
Analysis of Variance 

Source DF 55 М5 F P 
Regression 1 3390.6 3390.6 325.08 0.000 
Residual Error 31 323,3 10.4 

Total 32 3713.9 


Figura 11.7: Salida de resultados de MINITAB рага la prueba t de los datos del ejemplo 11.1. 


х х 
а) b) 


Figura 11.8: No se rechaza la hipótesis Н: 8, = 0. 


cas que aparecen en la figura 11.9 ilustran los escenarios posibles. Como se muestra en 
el inciso a de la figura, el rechazo de H, sugiere que la relación en efecto es lineal. En 
el caso del inciso b, lo que se observa sugiere que, aunque el modelo contenga un efecto 
lineal, se podría obtener una mejor representación si se incluyera un término polinomial 
(tal vez cuadrático), es decir, términos que complementen el término lineal. 


Inferencia estadística sobre la intersección 


Los intervalos de confianza y la prueba de hipótesis del coeficiente 5, se podrían estable- 
cer a partir del hecho de que B, también se distribuye de forma normal. No es difícil 
demostrar que 


Bo — Po 
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(a) (b) 
Figura 11.9: Se rechaza la hipótesis de que Н: 8, = 0. 


tiene una distribución £ con n — 2 grados de libertad, de manera que podemos construir 
un intervalo de confianza de 100(1 — 0)% рага о. 


Intervalo de Un intervalo de confianza de 100(1 — @)% para el parámetro 6, en la recta de regresión 
confianza para B, Шу, = В, + В,хеѕ 


x? < Во <bo+faj2 


S S 
hito > 
е MS yx = MS yx 

i=l 


donde £, y €S un valor de la distribución £ соп n — 2 grados de libertad. 


Ejemplo 11.4: | Calcule un intervalo de confianza de 95% рага {3 en la recta de regresión Ш, = B,+Bx 
con base en los datos de la tabla 11.1. 
Solución: En los ejemplos 11.1 y 11.2 se encontró que 


Sir =4152.18 y 5= 3.2295. 


Del ejemplo 11.1 se tiene que 


Xa? =41,086 у һу = 3.829633. 
i=l 


Si usamos la tabla A.4, encontramos que 1, p; = 2.045 para 31 grados de libertad. Por lo 


tanto, un intervalo de confianza de 95% para 8, es 


(2.045)(3.2295) y41,086 (2.045)(3.2295) y/41,086 
yv 63)14152.18) 1 63)14152.18) 


que se simplifica a 0.2132 < Bo < 7.4461. 2 


3.829633 — 


< Во < 3.829633 + 
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Para probar la hipótesis nula A, de que 6, = 8, en comparación con una alternativa 
posible utilizamos la distribución f£ con п — 2 grados de libertad para establecer una re- 
gión crítica y, luego, basar nuestra decisión en el valor de 


bo — Boo 


Ў y xX? /(п$хху) 
ү і=1 


Ejemplo 11.5: | Utilice el valor estimado de b, = 3.829633 del ejemplo 11.1 y, a un nivel de significancia 
de 0.05, pruebe la hipótesis de que 8, = 0 en comparación соп la alternativa de que 
B, F 0. Entonces 
Solución: Las hipótesis son Н: 6, = 0 y Н: В, £ 0. Así que, 


3.829633—0 
3.2295 4/41,086/[033)(4152.18)] 


=2.17, 


con 31 grados de libertad. Por lo tanto, Р = valor Р ~ 0.038 y concluimos que В, # 0. 
Observe que esto tan sólo es Coef desviación estándar, como se aprecia en la salida de 
resultados de MINITAB en la figura 11.7. El SE Coef es el error estándar de la intersec- 
ción estimada. I 


Una medida de la calidad del ajuste: el coeficiente de determinación 


Observe en la figura 11.7 que aparece un elemento denotado con R-Sq, cuyo valor es 
91.3%. Esta cantidad, R?, se denomina coeficiente de determinación y es una medida 
de la proporción de la variabilidad explicada por el modelo ajustado. En la sección 
11.8 se presentará el concepto del método del análisis de varianza para la prueba de 
hipótesis en la regresión. El enfoque del análisis de varianza utiliza la suma de los cua- 


drados del error SCE = рз (у; — $1)? y la suma total де los cuadrados corregida STCC 


= У — У;)?. Esta última representa la variación en los valores de respuesta que 
i= 
idealmente serían explicados con el modelo. El valor de la SCE es la variación debida al 
error, o la variación no explicada. Resulta claro que si la SCE = О, toda variación 


queda explicada. La cantidad que representa la variación explicada es STCC — SCE. К es el 


SCE 
STCC 


Advierta que si el ajuste es perfecto, todos los residuales son cero, y así R? = 1.0. Pero 
si la SCE es tan sólo un poco menor que la STCC, R? ~ 0. Observe en la salida de resul- 
tados de la figura 11.7 que el coeficiente de determinación sugiere que el modelo ajustado 
a los datos explica el 91.3% de la variabilidad observada en la respuesta, la reducción en 
la demanda de oxígeno químico. 

La figura 11.10 ofrece ejemplos de una gráfica con un buen ajuste (R? = 1.0) en a) 
y una gráfica con un ajuste deficiente (R? = 0) en b). 


Coeficiente de determinación: R? = 1 — 


Errores en el uso de R? 


Los analistas citan con mucha frecuencia los valores de R?, quizá debido a su simplici- 
dad. Sin embargo, hay errores en su interpretación. La confiabilidad de R? depende del 
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=> 


XI 
<> 


а) R? = 1.0 b) R? = 0 


Figura 11.10: Gráficas que ilustran un ajuste muy bueno y otro deficiente. 


tamaño del conjunto de los datos de la regresión y del tipo de aplicación. Resulta claro 
que 0 < R? < 1, y el límite superior se logra cuando el ajuste a los datos es perfecto, 
es decir, cuando todos los residuales son cero. ¿Cuál es un valor aceptable de R?? Se 
trata de una pregunta difícil de responder. Un químico encargado de establecer una cali- 
bración lineal de una pieza de equipo de alta precisión seguramente esperaría obtener un 
valor muy alto de R? (quizá superior a 0.99); mientras que un científico del comporta- 
miento, que trabaja con datos en los que influye la variabilidad de la conducta humana, 
quizá se sentiría afortunado si obtuviera un valor de R? de hasta 0.70. Un individuo con 
experiencia en el ajuste de modelos tiene la sensibilidad para saber cuándo un valor es 
suficientemente grande dada la situación que está enfrentando. Es evidente que algunos 
fenómenos científicos se prestan más a un modelamiento más preciso que otros. 

Es peligroso usar el criterio de R? para comparar modelos en competencia para el 
mismo conjunto de datos. Cuando se agregan términos adicionales al modelo, por ejem- 
plo un regresor más, disminuye la SCE, lo que provoca que R? aumente (o al menos no 
disminuya). Esto implica que R? se puede volver artificialmente elevado por medio de la 
práctica inapropiada de sobreajustar, es decir, de incluir demasiados términos en el 
modelo. Por consiguiente, el incremento inevitable de R? que se logra al agregar térmi- 
nos adicionales no implica que éstos se necesitaban. En realidad, el modelo simple puede 
ser mejor para predecir los valores de la respuesta. En el capítulo 12, cuando se presente 
el concepto de los modelos que implican más de un solo regresor, se estudiará con 
detalle el papel del sobreajuste y su influencia sobre la capacidad de predicción. En este 
momento baste decir que para seleccionar un modelo no se debe adoptar un proceso de 
selección que sólo incluya la consideración de R?. 


11.6 Predicción 


Hay varias razones para construir un modelo de regresión lineal. Una de ellas es, desde 
luego, predecir valores de respuesta para uno o más valores de la variable independiente. 
En esta sección se centra el enfoque en los errores asociados con la predicción. 
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La ecuación Y = b, y b x se puede utilizar para predecir o estimar la respuesta me- 
dia ру, en x = х,, donde х, no necesariamente es uno de los valores preestablecidos, о 
cuando х = x,, se podría emplear para pronosticar un solo valor y, de la variable Y,. Se 
esperaría que el error de predicción fuera mayor para el caso de un solo valor pronosti- 
cado que para aquel en que se predice una media. Entonces, esto afectaría la anchura de 
los intervalos para los valores que se predicen. 

Suponga que el experimentador desea construir un intervalo de confianza para Uy] xo 
En tal caso debe usar el estimador puntual Y, = B, y Вх, para estimar ру, = 8, + B,x. 
Se puede demostrar que la distribución muestral de Y, es normal con media 


Шур, = E(Yo)= E(Bo+B1x0)= 8 + хо = Hy px, 


y varianza 


iL у= 
J д _ 2 _ 2 0 
Оў, = О©в+в,ух, TOF 4B (xo) © E + 5 > 
Хх 


esta última surge del hecho de que Соу(Ү,, В) = 0 (véase el ejercicio de repaso 11.61 
de la página 438). Por consiguiente, ahora podemos construir un intervalo de confian- 
za de 100(1 – @)% sobre la respuesta media Ly; x, a partir del estadístico 


Т = Yo — Hy [хо 
S \/1/п + (хо — *)?/$у 


que tiene una distribución £ con n – 2 grados de libertad. 


Intervalo de Un intervalo de confianza de 100(1 — @)% para la respuesta media Uy; y, es 
confianza 


id 1 (ко 2) 1 (ко –2)2 
o — t -+ = < < ĵo +1 -+ =—, 
Yo — ta/25\ 7 + So HY lxy < Уо + la/25 я + б 


t, €S UN valor de la distribución £ con n — 2 grados de libertad. 


Ejemplo 11.6: | Con los datos de la tabla 11.1 construya límites de confianza de 95% para la respuesta 
media y] xo: 
Solución: A partir de la ecuación de regresión encontramos que, para x, = 20% de reducción de 
sólidos, digamos, 


Yo = 3.829633 +(0.903643)(20) =21.9025. 


Además, х = 33.4545, 5 = 4152.18, s = 3.2295 y 1, ps = 2.045 para 31 grados de 


libertad. Por lo tanto, un intervalo de confianza de 95% para Шуро €S 


1 (20 — 33.4545)? 
21.9025 — (2.045)(3.2295) y A A 


[1 (20 — 33.4545)? 
21.902 2.045)(3.22 , 
< 21.9025 + (2.045)(3.2295) 3 + 4152.18 


o simplemente, 20.1071 < Шу» < 23.6979. J 
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Si repetimos los cálculos anteriores para cada uno de los diferentes valores de x, 
obtenemos los límites de confianza correspondientes para cada Ly; x, En la figura 11.11 
se presentan los datos de los puntos, la recta de regresión estimada y los límites de con- 
fianza superior e inferior sobre la media de Y |х. 

En el ejemplo 11.6 tenemos 95% de confianza en que la reducción media poblacio- 


y 
50 Y = bo + Бух 
45 
40 
35 
30 
25 
20 
15 
10 

E 


5 
12 х 


O 3 6 9 12 15 18 2124 27 30 33 36 39 42 45 48 51 54 


Figura 11.11: Límites de confianza para el valor medio de У|х. 


nal en la demanda de oxígeno químico estará entre el 20.1071% y 23.6979%, cuando la 
reducción de sólidos sea de 20%. 


Predicción del intervalo 


Otro tipo de intervalo que con frecuencia se malinterpreta y se confunde con aquel dado 
рага и, es el intervalo de la predicción para una respuesta futura observada. En reali- 
dad, en muchos casos el intervalo de la predicción es más relevante para el científico o 
el ingeniero que el intervalo de confianza sobre la media. En el ejemplo del contenido de 
alquitrán y la temperatura de entrada, mencionado en la sección 11.1, seguramente sería 
interesante no sólo estimar la media del contenido de alquitrán a una temperatura espe- 
cífica, sino también construir un intervalo que refleje el error en la predicción de una 
cantidad futura observada del contenido de alquitrán a la temperatura dada. 

Para obtener un intervalo de predicción para cualquier valor único y, de la variable 
Y, es necesario estimar la varianza de las diferencias entre las ordenadas у, obtenidas de 
las rectas de regresión calculadas en el muestreo repetido cuando x = x,, y la ordenada 
verdadera correspondiente у,. Podríamos considerar la diferencia ), — y, como un valor 
de la variable aleatoria Y, — Y,, cuya distribución muestral se podría demostrar que es 
normal con media 


Mz, у, = E(Yo — Yo) = ElBo + Вухо — (Bo + Bixo + €0)] = 0 
y varianza 


A 

2 2 -a = 42 2 0 i 

Оў ү, = OB, +B 1x060 = OÈ 4B i (xo—8)— eo =0°|l+ n F S d 
XX 
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Así, un intervalo de predicción de 100(1 — @)% para un solo valor pronosticado y, se 
puede construir a partir del estadístico 


Ye =Y 
Т = > 
Sy 1+1/n + (хо — ®)?/$х 


que tiene una distribución £ con n — 2 grados de libertad. 


Intervalo de 
predicción 
para y, 


Un intervalo de predicción de 100(1 — 2)% para una sola respuesta y, es dado por 


1 o —х)? 


1 fp =P 
ў tasi 1 +7 += += 


< уо < ĵo + ta/2s4/1 + — 7 
Уо < Уо a/2 P Sa 


donde 1 j2 €S un valor de la distribución £ con n — 2 grados de libertad. 


Es claro que hay una diferencia entre el concepto de un intervalo de confianza y el 
del intervalo de predicción antes descrito. La interpretación del intervalo de confianza es 
idéntica a la que se describió para todos los intervalos de confianza sobre los parámetros 
de la población estudiados en el libro. De hecho, Ly; y, es un parámetro de la población. 
Sin embargo, el intervalo de la predicción calculado representa un intervalo que tiene 
una probabilidad igual a 1 — а de contener no un parámetro sino un valor futuro de y, de 
la variable aleatoria Y,. 


Ejemplo 11.7: | Con los datos de la tabla 11.1 construya un intervalo de predicción de 95% para y, cuan- 


Solución: 
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do x, = 20%. 

Tenemos que n = 33, хо =20, х = 33.4545, Yo = 21.9025, Sy, = 4152.18, s = 3.2295, 
У б» 2.045 рага 31 grados de libertad. Por lo tanto, un intervalo de predicción de 
95% para y, es 


| 1 (20 — 33.4545)? 
21.9025 — (2.045)(3.22 1 
9025 — (2.045)(3.2295) + 33 + 4152.18 < уо 


(20 — 33.4545)? 
4152.18 | 


1 
< 21.9025 + (2.045)(3.2295) ү + 33 + 


que se simplifica como 15.0585 < yo < 28.7464. I 

En la figura 11.12 se presenta otra gráfica de los datos de reducción de la demanda 
de oxígeno químico, tanto con los intervalos de confianza de la respuesta media como con 
el intervalo de predicción sobre una respuesta individual. En el caso de la respuesta me- 
dia la gráfica refleja un intervalo mucho más angosto alrededor de la recta de regresión. 


11.15 Remítase al ejercicio 11.1 de la página 398, 11.16 Remítase al ejercicio 11.2 de la página 398, 


a) evalúe s?; 


a) evalúe s?; 


b) pruebe la hipótesis de que 6, = 0 en comparación b) construya un intervalo de confianza de 95% para 


con la alternativa de que 6, F 0 a un nivel de sig- Bu 
nificancia de 0.05, e interprete la decisión resul- с) construya un intervalo de confianza de 95% para 
tante. В.. 

1 
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20 30 40 50 


Reducción de sólidos 


Figura 11.12: Intervalos de confianza y predicción para los datos de la reducción de la 
demanda de oxígeno químico; las bandas internas indican los límites de confianza para 
las respuestas medias y las externas señalan los límites de predicción para las respuestas 


futuras. 


11.17 Remítase al ejercicio 11.5 de la página 398, 
a) evalúe s?; 
b) construya un intervalo de confianza de 95% para 
Bo 
c) construya un intervalo de confianza de 95% para 
Р 
11.18 Remítase al ejercicio 11.6 de la página 399, 
a) evalúe s?; 
b) construya un intervalo de confianza de 99% para 
By 
c) construya un intervalo de confianza de 99% para 
Р 
11.19 Remítase al ejercicio 11.3 de la página 398, 
a) evalúe s?; 
b) construya un intervalo de confianza de 99% para 
Bs 
с) construya un intervalo de confianza de 99% para 
Ё 
11.20 Pruebe la hipótesis de que 8, = 10 en el ejerci- 
cio 11.8 de la página 399, en comparación con la alter- 
nativa de que 8, < 10. Utilice un nivel de significancia 
de 0.05. 


11.21 Pruebe la hipótesis de que 8, = 6 en el ejercicio 
11.9 de la página 399, en comparación con la alternativa 
de que 8, < 6. Utilice un nivel de significancia de 0.025. 


11.22 Utilice el valor de s? que se obtuvo en el ejerci- 
cio 11.164 para construir un intervalo de confianza de 
95% para Шү ¡g5 EN el ejercicio 11.2 de la página 398. 


11.23 Remítase al ejercicio 11.6 de la página 399 y 
utilice el valor de s? que se obtuvo en el ejercicio 11.18a 
para calcular 
a) un intervalo de confianza de 95% para la resisten- 
cia media al corte cuando x = 24.5; 
b) un intervalo de predicción de 95% para un solo 
valor pronosticado de la resistencia al corte cuan- 
do x = 24.5. 


11.24 Utilice el valor de s? que se obtuvo en el ejerci- 
cio 11.17a) y grafique la regresión lineal y las bandas 
de confianza de 95% para la respuesta media иу, en el 
caso de los datos del ejercicio 11.5 de la página 598. 


11.25 Utilice el valor де 5? que se obtuvo en el ејегсі- 
cio 11.17a) y construya un intervalo de confianza de 
95% para la cantidad de azúcar convertida correspon- 
diente a x = 1.6 en el ejercicio 11.5 de la página 398. 


11.26 Remítase al ejercicio 11.3 de la página 398, y 
utilice el valor de s? que se obtuvo en el ejercicio 11.19a 
para calcular 
a) un intervalo de confianza de 99% para la cantidad 
promedio del producto químico que se disolverá 
en 100 gramos de agua a 50°С; 
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b) un intervalo de predicción de 99% para la cantidad 
de producto químico que se disolverá en 100 gra- 
mos de agua a 50°С. 


11.27 Considere la regresión de la distancia recorrida 
para ciertos automóviles, en millas por galón (mpg) y 
su peso en libras (wt). Los datos son de la revista Con- 
sumer Reports (abril de 1997). En la figura 11.13 se 
presenta una parte de la salida del SAS con los resulta- 
dos del procedimiento. 

a) Estime la distancia recorrida para un vehículo que 
pesa 4000 libras. 

b) Suponga que los ingenieros de Honda afirman 
que, en promedio, el Civic (o cualquier otro mode- 
lo que pese 2440 libras) recorre más de 30 millas 
por galón (mpg). Con base en los resultados del 
análisis de regresión, ¿creería usted dicha afirma- 
ción? Explique su respuesta. 

c) Los ingenieros de diseño del Lexus ES300 consi- 
deraron que un rendimiento de 18 mpg sería el 
objetivo ideal para dicho modelo (o cualquier otro 
modelo que pese 3390 libras), aunque se espera 
que haya cierta variación. ¿Es probable que ese 
objetivo sea realista? Comente al respecto. 


11.28 Existen aplicaciones importantes en las que, 
debido a restricciones científicas conocidas, la recta de 
regresión debe atravesar el origen, es decir, la inter- 
sección debe estar en el cero. En otras palabras, el mo- 
delo debe ser 


Ү = Вх: + е, 
y tan sólo se requiere estimar un parámetro sencillo. 


Con frecuencia a este modelo se le denomina modelo 
de regresión por el origen. 


=D 
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a) Demuestre que el estimador de mínimos cuadra- 
dos para la pendiente es 


n 
b = У ху 


ї=1 


п 
2 
Xi 


i=l 


b) Demuestre que с, = (2 x) 
i=l 


c) Demuestre que b, del inciso a es un estimador inses- 
gado para 3. Es decir, demuestre que E(B) = |. 


11.29 Dado el conjunto de datos 


y х 
7 2 
50 15 
100 30 
40 10 
70 20 


a) Grafique los datos. 
b) Ajuste una recta de regresión por el origen. 
c) Grafique la recta de regresión sobre la gráfica de 


los datos. 

d) Calcule una fórmula general (en términos de y, y la 
pendiente р.) рага el estimador de o”. 

e) Calcule una fórmula para Var(5); i = 1, 2, ..., п, 


aplicable a este caso. 


f) Grafique límites de confianza de 95% para la res- 
puesta media alrededor de la recta de regresión. 


11.30 Para los datos del ejercicio 11.29 calcule un 
intervalo de predicción de 95% en x = 25. 


Root MSE 1.48794 R-Square 0.9509 
DependentMean 21.50000 Adj R-Sq 0.9447 
Parameter Estimates 
Parameter Standard 
Variable DF Estimate Error t Value Рг > |t] 
Intercept 1 44.78018 1.92919 23,21 <.0001 
WT 1 -0.00686 0.00055133 -12.44 <.0001 
MODEL WT MPG Predict LMean UMean Lpred Upred Residual 
GMC 4520 15 13.7720 11.9752 15.5688 9.8988 17.6451 1.22804 
Сео 2065 29 30.6138 28.6063 32.6213 26.6385 34.5891 -1.61381 
Honda 2440 31 28.0412 26.4143 29.6681 24.2439 31.8386 2.95877 
Hyundai 2290 28 29.0703 27.2967 30.8438 25.2078 32.9327 -1.07026 
Infiniti 3195 23 22.8618 21.7478 23.9758 19.2543 26.4693 0.13825 
Isuzu 3480 21 20.9066 19.8160 21.9972 17.3062 24.5069 0.09341 
Јеер 4090 15 16.7219 15.3213 18.1224 13.0158 20.4279 -1.72185 
Land 4535 13 13.6691 11.8570 15.4811 9.7888 17.5493 -0.66905 
Lexus 3390 22 21.5240 20.4390 22.6091 17.9253 25.1227 0.47599 
Lincoln 3930 18 17.8195 16.5379 19.1011 14.1568 21.4822 0.18051 


Figura 11.13: Salida de resultados del SAS рага el ejercicio 11.27. 
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11.7 Selección de un modelo de regresión 


Gran parte de lo que se ha presentado hasta ahora acerca de la regresión que involucra 
una sola variable independiente depende de la suposición de que el modelo elegido es 
correcto, la suposición de que yx se relaciona con x linealmente en los parámetros. 
Es cierto que no se esperaría que la predicción de la respuesta fuera buena si hubiera 
diversas variables independientes que no se tomaran en cuenta en el modelo, que afectaran 
la respuesta y variaran en el sistema. Además, la predicción seguramente sería inadecuada 
si la estructura verdadera que relaciona ру; con х fuera extremadamente no lineal en el 
rango de las variables consideradas. 

Es frecuente que se utilice el modelo de regresión lineal simple aun cuando se sepa 
que el modelo no es lineal o que se desconozca la estructura verdadera. Este método 
suele ser acertado, en particular cuando el rango de las x es estrecho. De esta manera, el 
modelo que se utiliza se vuelve una función de aproximación que se espera sea una re- 
presentación adecuada del panorama verdadero en la región de interés. Sin embargo, hay 
que señalar el efecto que tendría un modelo inadecuado sobre los resultados presentados 
hasta este momento. Por ejemplo, si el modelo verdadero, desconocido para el experi- 
mentador, es lineal en más de una x, digamos, 


Шух, = Po + Brx1 + B2x2, 


entonces el estimado b, = 5, /5,, de los mínimos cuadrados ordinarios que se calcula 
considerando tan sólo x, en el experimento es, en circunstancias generales, un estimado 
sesgado del coeficiente 8, donde el sesgo es una función del coeficiente adicional 8, 
(véase el ejercicio de repaso 11.65 en la página 438). Asimismo, el estimado s? para о? 
es sesgado debido a la variable adicional. 


11.8 El método del análisis de varianza 


Con frecuencia el problema de analizar la calidad de la recta de regresión estimada se 
maneja por medio del método del análisis de varianza (ANOVA), que es un procedi- 
miento mediante el cual la variación total de la variable dependiente se subdivide en 
componentes significativos, que luego se observan y se tratan en forma sistemática. El 
análisis de varianza, que se estudia en el capítulo 13, es un recurso poderoso que se em- 
plea en muchas situaciones. 

Suponga que tenemos п puntos de datos experimentales en la forma usual (х, у) y 
que se estima la recta de regresión. En la sección 11.4 para la estimación de о? se esta- 
bleció la identidad 

Sy = biS xy +SCE. 


Una formulación alternativa y quizá más informativa es la siguiente: 
n n n 
-у2 say a 32 
Уо. 3 = Y – 9)? + Уу 90). 
¡=1 i=l i=l 


Logramos hacer una partición de la suma total de los cuadrados corregida de y en dos 
componentes que deberían proporcionar un significado particular para el experimenta- 
dor. Esta partición se debería indicar en forma simbólica como 


STCC = SCR + SCE. 
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El primer componente de la derecha, SCR, se denomina suma de cuadrados de la re- 

gresión y refleja la cantidad de variación de los valores y que se explica con el modelo, 

que en este caso es la línea recta postulada. El segundo componente es la ya conocida 

suma de cuadrados del error, que refleja la variación alrededor de la recta de regresión. 
Suponga que nos interesa probar la hipótesis 


Но: В = 0 en comparación con Hı: В; # 0, 


donde la hipótesis пша en esencia dice que el modelo es ру, = 8; es decir, la variación 
en los resultados Y debida a las fluctuaciones de probabilidad o aleatorias que son inde- 
pendientes de los valores de x. Esta condición se refleja en la figura 11.105). En las 
condiciones de esta hipótesis nula se puede demostrar que SCR/a?, y $СЕ/ о? son va- 
lores de variables chicuadradas independientes con 1 y п— 2 grados de libertad, respec- 
tivamente y, usando el teorema 7.12, se sigue que STCC/0? también es un valor de una 
variable chi cuadrada con n — 1 grados de libertad. Para probar la hipótesis anterior 
calculamos 


= SCR/1 SCR 
О SCE/(n-2) 2 


f 


y rechazamos H, al nivel de significancia œ cuando f > fa(1,n — 2). 

Por lo general los cálculos se resumen mediante las medias de una tabla de análisis 
de varianza, como se indica en la tabla 11.2. Es costumbre referirse a las distintas sumas 
de los cuadrados divididos entre sus respectivos grados de libertad como cuadrados 


medios. 
Tabla 11.2: Análisis de varianza para la prueba de 8 = 0 
Fuente de Suma de Grados de Cuadrado 
variación cuadrados libertad medio f calculada 
Regresión SCR 1 SCR SCR 
Error SCE п —2 52 = ЭСЕ 
Total STCC п—1 


Cuando se rechaza la hipótesis nula, es decir, cuando el estadístico F calculado ех- 
cede al valor crítico f,(1, n — 2), concluimos que hay una cantidad significativa de 
variación en la respuesta justificada por el modelo postulado, que es la función 
de la línea recta. Si el estadístico F está en la región de no rechazo, se concluye que los 
datos no reflejan evidencia suficiente para apoyar el modelo que se postula. 

En la sección 11.5 se presentó un procedimiento donde se usa el estadístico 


T= Bı — ßio 
S/ VS 


para probar la hipótesis 


Ho: Bı = Bio contra Hi: 8 F Bio, 


donde Т sigue la distribución £ con n — 2 grados de libertad. La hipótesis se rechaza si 
ld >, j Para un nivel de significancia с. Es interesante observar que en el caso especial 
en que probamos 
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Ho: В = Оеп comparación con Hı: 8 # 0, 
el valor del estadístico T se convierte en 


b 


pa == 


1 
S/N Sa 


y la hipótesis a considerar es idéntica a la que se prueba en la tabla 11.2. En otras palabras, 
la hipótesis nula establece que la variación en la respuesta se debe tan sólo al azar. El 
análisis de varianza utiliza la distribución F en vez de la distribución т. Para la alternativa 
bilateral ambos enfoques son idénticos. Esto se observa si se escribe 


2 _Ю5« _ М5 _ SCR 
= 2 - 


S 


que da como resultado un valor idéntico al valor Futilizado en el análisis de varianza. La 
relación fundamental entre la distribución £ con v grados de libertad y la distribución F 
con 1 y v grados de libertad es 


2 =fF(1 y. 


Desde luego, la prueba ѓ permite probar en comparación con una alternativa unilateral, 
en tanto que la prueba F está restringida a una prueba en comparación con una alternati- 
va bilateral. 


Salida de resultados por computadora comentados 
para la regresión lineal simple 


Considere nuevamente los datos de la tabla 11.1 sobre la reducción de la demanda de 
oxígeno químico. En las figuras 11.14 y 11.15 se presentan salidas de los resultados por 
computadora más completos. De nuevo se ilustran con el software MINITAB. La colum- 
na de la razón t indica pruebas para la hipótesis nula de valores de cero еп el parámetro. 
El término “Fit” denota los valores $, que con frecuencia se denominan valores ajusta- 
dos. El término “SE Fit” se emplea para calcular los intervalos de confianza sobre la 
respuesta media. El elemento R? se calcula como (SCR/STCC) x 100, y significa la 
proporción de variación en y explicada por la regresión de la línea recta. Asimismo, se 
incluyen los intervalos de confianza sobre la respuesta media y los intervalos de predic- 
ción sobre una observación nueva. 


11.9 Prueba para la linealidad de la regresión: 


datos con observaciones repetidas 


En ciertos tipos de situaciones experimentales el investigador tiene la capacidad de efec- 
tuar observaciones repetidas de la respuesta para cada valor de x. Aunque no es necesario 
tener dichas repeticiones para estimar 8, y 8, las repeticiones permiten al experimenta- 
dor obtener información cuantitativa acerca de lo apropiado que resulta el modelo. De 
hecho, si se generan observaciones repetidas, el investigador puede efectuar una prueba 
de significancia para determinar si el modelo es o no adecuado. 
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The regression equation is COD = 3.83 + 0.904 Per Red 


Predictor Coef SE Coef T Р 
Constant 3.830 1.768 2:17 0.038 
Per Red 0.90364 0.05012 18.03 0.000 
5 = 3.22954 R-Sq = 91.3% R-Sq(adj ) = 91.0% 
Analysis of Variance 
Source DF 55 М5 Е Р 
Regression 1 3390.6 3390.6 325.08 0.000 
Residual Error 31 323.3 10.4 
Total 32 күй к 
Obs Per_Red COD Fit SE Fit Residual St Resid 
1 3.0 5.000 6.541 1.627 -1.541 -0.55 
2 36.0 34.000 36.361 0.576 -2.361 -0.74 
3 7.0 11.000 10.155 1.440 0.845 0.29 
4 37.0 36.000 37.264 0.590 -1.264 -0.40 
5 11.0 21.000 13.770 1.258 7.230 2.43 
6 38.0 38.000 38.168 0.607 -0.168 -0.05 
7 1:50 16.000 17.384 1.082 -1.384 -0.45 
8 39.0 37.000 39.072 0.627 =2.07а -0.65 
9 18.0 16.000 20.095 0.9857 -4.095 = 1.39 
10 39.0 36.000 39.072 0.627 =3:.07:2 -0.97 
LE 27.0 28.000 28.228 0.649 -0.228 -0.07 
12 39.0 45.000 394072 0.627 5.928 1.87 
13 29.0 27.000 30.035 0.605 =3.:03/5 -0.96 
14 40.0 39.000 39.975 0.651 =0::9:75 =0.31 
tS 30.0 25.000 30.939 0.588 =D:9:3:9 -1.87 
16 41.0 41.000 40.879 0.678 0.121 0.04 
17 30.0 35.000 30.939 0.588 4.061 1.28 
18 42.0 40.000 41.783 0.707 -1.783 =0. 57 
19 310 30.000 31.843 0.575 -1.843 -0.58 
20 42.0 44.000 41.783 0.707 22231097 0.70 
21 3140 40.000 31.843 0.575 8.157 22.97. 
22 43.0 37.000 42.686 0.738 -5.686 =1..81 
23 32.0 32.000 32.746 0.567 -0.746 023 
24 44.0 44.000 43.590 0.772 0.410 0713 
25 33.20 34.000 33.650 0.563 0.350 0.211 
26 45.0 46.000 44.494 0.807 1.506 0.48 
27 13.0 32.000 33.650 0.563 -1.650 -0.52 
28 46.0 46.000 45.397 0.843 0.603 0. 19 
29 34.0 34.000 34.554 0.563 -0.554 0,17 
30 47.0 49.000 46.301 0.881 2.699 0.87 
aL 36.0 37.000 36.361 0.576 0.639 0.20 
32 50.0 51.000 49.012 1.002 1.988 0.65 
33 36.0 38.000 36.361 0.576 1.639 0.52 


Figura 11.14: Salida de resultados de MINITAB de la regresión lineal simple para los 
datos de reducción de la demanda de oxígeno químico; parte I. 


Seleccionemos una muestra aleatoria de n observaciones utilizando k valores distin- 
tos de x, por ejemplo, x, х,,..., X, tales que la muestra contenga n, valores observados de 
la variable aleatoria Y, correspondientes a los valores x,, con n, valores observados de Y, 
correspondientes a х,,..., п, valores observados de Y, correspondientes a х,. Necesaria- 


mente, п = У) п;. 
і=1 
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Obs Fit SE Fit 95% CI 95% PI 

1 6.541 1.627 (31223; 9.858) (-0.834, 13.916) 

2 36.361 0.576 (35.185, 37.537) (29.670, 43.052) 

3 10.155 1.440 ( 7.218, 13.092) ( 2.943, 17.367) 

4 37.264 0.590 (36.062, 38.467) (30.569, 43.960) 

5 13.770 1.258 (11.204, 16.335) ( 6.701, 20.838) 

6 38.168 0.607 (36.931, 39.405) (31.466, 44.870) 

7 17.384 1.082 (15.177, 19.592) (10.438, 24.331) 

8 39.072 0.627 (37.793, 40.351) (32.362, 45.781) 

9 20.095 0.957 (18.143, 22.047) (13.225, 26.965) 
10 39.072 0.627 (37.793, 40.351) (32.362, 45.781) 
11 28.228 0.649 (26.905, 29.551) (21.510, 34.946) 
12 39.072 0.627 (37.793, 40.351) (32.362, 45.781) 
13 30.035 0.605 (28.802, 31.269) (23.334, 36.737) 
14 39.975 0.651 (38.648, 41.303) (33.256, 46.694) 
15 30,939 0.588 (29.739, 32.139) (24.244, 37.634) 
16 40.879 0.678 (39.497, 42.261) (34.149, 47.609) 
17 30.939 0.588 (29.739, 32.139) (24.244, 37.634) 
18 41.783 0.707 (40.341, 43.224) (35.040, 48.525) 
19 31.843 0.575 (30.669, 33.016) (25.152, 38.533) 
20 41.783 0.707 (40.341, 43.224) (35.040, 48.525) 
21 31.843 0.575 (30.669, 33.016) (25.152, 38.533) 
22 42.686 0.738 (41.181, 44.192) (35.930, 49.443) 
23 32.746 0.567 (31.590, 33.902) (26.059, 39.434) 
24 43.590 0.772 (42.016, 45.164) (36.818, 50.362) 
25 33.650 0.563 (32.502, 34.797) (26.964, 40.336) 
26 44.494 0.807 (42.848, 46.139) (37.704, 51.283) 
27 33.650 0.563 (32.502, 34.797) (26.964, 40.336) 
28 45.397 0.843 (43.677, 47.117) (38.590, 52.205) 
29 34.554 0.563 (33.406, 35.701) (27.868, 41.239) 
30 46.301 0.881 (44.503, 48.099) (39.473, 53.128) 
31 36:361 0.576 (35.185, 37.537) (29.670, 43.052) 
32 49.012 1.002 (46.969, 51.055) (42.115, 55.908) 
33 36.361 0.576 (35,185. -30:537;) (29.670, 43.052) 


Figura 11.15: Salida de resultados de MINITAB de la regresión lineal simple para los 
datos de reducción de la demanda de oxígeno químico; parte II. 


Definimos 


< 
І 


el j-ésimo valor de la variable aleatoria Y, 


ni 
ур = Т = У», 


j=1 
Т. 
ni 
Entonces, si se realizaron n, = 3 mediciones de Y que corresponden a x = x, estas ob- 
servaciones se indicarían por medio de у, , y,, Y y,¿- Por lo tanto, 
Ti = улу + удэ + Улз. 


El concepto de la falta de ajuste 


La suma de cuadrados del error consta de dos partes: la cantidad debida a la variación 
entre los valores de Y dentro de valores dados de x, y un componente que normalmente 
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se denomina contribución a la falta de ajuste. El primer componente refleja tan sólo la 
variación aleatoria, o error experimental puro, en tanto que el segundo es una medida 
de la variación sistemática introducida por los términos de orden superior. En nuestro 
caso éstos son términos de x distintos de la contribución lineal o de primer orden. Obser- 
ve que al elegir un modelo lineal en esencia asumimos que este segundo componente no 
existe y que, en consecuencia, la suma de cuadrados del error se debe por completo a 
errores aleatorios. Si éste fuera el caso, entonces s? = SCE/(n-— 2) es un estimado inses- 
gado de o°. Sin embargo, si el modelo no se ajusta a los datos en forma apropiada, en- 
tonces la suma de cuadrados del error estará inflada y producirá un estimador sesgado de 
o°. Ya sea que el modelo se ajuste o no a los datos, siempre que se tienen observaciones 
repetidas es posible obtener un estimador insesgado de о? calculando 


para cada uno de los k valores distintos de x y, después, agrupando estas varianzas, tenemos 


k ni 


k 
Doa- D D 05 IY 
2 —!=! talje 


n—k n—k 


El numerador de 5? es una medida del error experimental puro. A continuación se 
presenta un procedimiento de cálculo para separar la suma de los cuadrados del error en 
los dos componentes que representan el error puro y la falta de ajuste: 


Cálculo 

de la suma de los 
cuadrados de la 
falta de ajuste 


1. Calcular la suma de los cuadrados del error puro 


п; 


k 
Уз» е. 


i=l ј=1 


Esta suma de cuadrados tiene n — k grados de libertad asociados con ella, y el cuadrado 
medio resultante es el estimador insesgado s? de o°. 

2. Restar la suma de los cuadrados del error puro de la suma de los cuadrados del error, 
SCE, con lo que se obtiene la suma de los cuadrados debida a la falta de ajuste. Los 


grados de libertad de la falta de ajuste también se obtienen simplemente restando 
(n—2) — (п—®Ё) = k-2. 


Los cálculos necesarios para probar hipótesis en un problema de regresión con medicio- 
nes repetidas de la respuesta se pueden resumir como se muestra en la tabla 11.3. 

Las figuras 11.16 y 11.17 ilustran los puntos muestrales para las situaciones del 
“modelo correcto” y del “modelo incorrecto”. En la figura 11.16, donde ру, cae sobre 
una línea recta, no hay falta de ajuste cuando se asume un modelo lineal, por lo que 
la variación muestral alrededor de la recta de regresión es un error puro que resulta de la 
variación que ocurre entre observaciones repetidas. En la figura 11.17, donde es evidente 
que ру по cae sobre una línea recta, la responsable de la mayor parte de la variación 
alrededor de la recta de regresión, además del error puro, es la falta de ajuste que resulta 
de seleccionar por error un modelo lineal. 
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Tabla 11.3: Análisis de varianza para la prueba de linealidad de la regresión 


Fuente de Suma de Grados de Cuadrados 

variación cuadrados libertad medios fcalculada 
Regresión SCR 1 SCR SCR 
Error SCE п—2 
Falta de ajuste [SCE-SCE (puro) к—2 шыр 5сЕ зс (puro) 
Error puro SCE (puro) n—k ге кыш 
Total STCC n—1 


Figura 11.16: Modelo lineal correcto con Figura 11.17: Modelo lineal incorrecto con 
componente sin falta de ajuste. componente de falta de ajuste. 


¿Por qué es importante detectar la falta de ajuste? 


El concepto de falta de ajuste es muy importante en las aplicaciones del análisis de re- 
gresión. De hecho, la necesidad de construir o diseñar un experimento que tome en 
cuenta la falta de ajuste se vuelve más crítica a medida que el problema y el mecanismo 
subyacente implicados se vuelven más complicados. Es cierto que no siempre se puede 
tener la certeza de que la estructura que se postula, en este caso el modelo de regresión 
lineal, sea una representación correcta o incluso adecuada. El ejemplo siguiente muestra 
la manera en que se parte la suma de cuadrados del error en los dos componentes que 
representan el error puro y la falta de ajuste. Lo adecuado del modelo se prueba al nivel 
de significancia œ, comparando el cuadrado medio de la falta de ajuste dividido entre 5° 
conf (k-2, n-k). 


Ejemplo 11.8: | En la tabla 11.4 se presenta el registro de las observaciones del producto de una reacción 
química tomadas a distintas temperaturas. Calcule el modelo lineal ру, = 8, + В,х y 
pruebe la falta de ajuste. 

Solución: Los resultados de los cálculos se presentan en la tabla 11.5. 
Conclusión: La partición de la variación total de esta manera revela una variación 
significativa debida al modelo lineal y una cantidad insignificante de variación debida a 
la falta de ajuste. Por consiguiente, los datos experimentales no parecen sugerir la nece- 
sidad de considerar en el modelo términos superiores a los de primer orden y no se re- 
chaza la hipótesis nula. И | 
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Tabla 11.4: Datos para el ejemplo 11.8 


yA) хСС) | y(%) хСС) 
77.4 150 88.9 250 
76.7 150 89.2 250 
78.2 150 89.7 250 
84.1 200 94.8 300 
84.5 200 94.7 300 
83.7 200 95.9 300 


Tabla 11.5: Análisis de varianza de los datos de producto-temperatura 


Fuente de Suma de Grados de Cuadrados 
variación cuadrados libertad medios f calculada Valores P 
Regresión 509.2507 1 509.2507 1531.58 < 0.0001 
Error 3.8660 10 
Falta de ajuste { 1.2060 { 2 0.6030 1.81 0.2241 
Error puro 2.6600 8 0.3325 
Total 513.1167 11 


Salida de resultados por computadora comentados 
para la prueba de falta de ajuste 


En la figura 11.18 se presenta una salida de resultados por computadora para el análisis 
de los datos del ejemplo 11.8 con el programa SAS. Observe la “LOF” con 2 grados de 
libertad, que representa las contribuciones cuadrática y cúbica al modelo, y el valor P 
de 0.22, que sugiere que el modelo lineal (de primer orden) es adecuado. 


Dependent Variable: yield 


Sum of 

Source DF Squares Mean Square F Value Pr > F 
Model 3 510.4566667 170.1522222 511.74 <.0001 
Error 8 2.6600000 0.3325000 
Corrected Total 11 513.1166667 

R-Square Coeff Var Root MSE yield Mean 

0.994816 0.666751 0.576628 86.48333 
Source DF Type I SS Mean Square F Value Pr > F 
temperature 1 509.2506667 509.2506667 153158 <.0001 
LOF 2 1.2060000 0.6030000 1.81 0.2241 


Figura 11.18: Salida de resultados del SAS que incluye el análisis de los datos del ejemplo 11.8. 


Ejercicios 

11.31 Enel ejercicio 11.3 de la página 398 pruebe la 11.33 Suponga que tenemos una ecuación lineal que 
linealidad de la regresión. Use un nivel de significancia pasa por el origen Hyją = Эх (ejercicio 11.28). 

de 0.05. Haga comentarios al respecto. a) Estime la regresión lineal que pasa por el origen 


11.32 En el ejercicio 11.8 de la página 399 pruebe la para los siguientes datos: 


linealidad de la regresión. Haga comentarios al respecto. 
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[05 15 32 42 51 6.5 
у|13 34 67 80 10.0 132 


b) Suponga que se desconoce si la regresión verdade- 
ra debería pasar por el origen. Estime el modelo 
lineal ру; = 8, + B,x y pruebe la hipótesis de que 
B, = 0 a un nivel de significancia de 0.10, en com- 
paración con la alternativa de que 8, # 0. 


11.34 En el ejercicio 11.5 de la página 398 utilice el 
método del análisis de varianza para probar la hipótesis 
de que 8, = 0, en comparación con la hipótesis alterna- 
tiva de que 8, + 0, a un nivel de significancia de 0.05. 


11.35 Los siguientes datos son el resultado de una 
investigación sobre el efecto de la temperatura de reac- 
ción x sobre la conversión porcentual de un proceso 
químico y. (Véase Myers, Montgomery y Anderson- 
Cook, 2009). Ajuste una regresión lineal simple y utili- 
ce pruebas de falta de ajuste para determinar si el 
modelo es adecuado. Analice los resultados. 


Temperatura Conversión 
Observación (°C), x (%), y 
1 200 43 
2 250 78 
3 200 69 
4 250 73 
5 189.65 48 
6 260.35 78 
7 225 65 
8 225 74 
9 225 76 
10 225 79 
11 225 83 
12 225 81 


11.36 La ganancia de un transistor en un dispositivo 
de circuito integrado, entre el emisor y el colector 
(ҺЕЕ), se relaciona con dos variables (Myers, Montgo- 
mery y Anderson-Cook, 2009) que se controlan en el 
proceso de deposición, controlado por el emisor en 
el tiempo (х,, en minutos) y la dosis del emisor (x,, 
en iones х 10'*). Se observaron 14 muestras después 
de la deposición y los datos resultantes se presentan en 
la tabla siguiente. Consideraremos modelos de regre- 
sión lineal usando la ganancia como respuesta y el con- 
trol del emisor en el tiempo o la dosis del emisor como 
la variable regresora. 


x1 (tiempo de x2 (dosis, у (ganancia 
Obs. control, min) ¡ones х 10!) о hFE) 
1 195 4.00 1004 
2 255 4.00 1636 
3 195 4.60 852 
4 255 4.60 1506 
5 255 4.20 1272 
6 255 4.10 1270 
7 255 4.60 1269 
8 195 4.30 903 
9 255 4.30 1555 
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10 255 4.00 1260 
11 255 4.70 1146 
12 255 4.30 1276 
13 255 4.72 1225 
14 340 4.30 1321 


a) Determine si el tiempo de control del emisor influ- 
ye en la ganancia en una relación lineal. Es decir, 
pruebe Н: 8, = 0, donde 6, es la pendiente de la 
variable regresora. 

b) Efectúe una prueba de falta de ajuste para determi- 
nar si la relación lineal es adecuada. Saque sus 
conclusiones. 

c) Determine si la dosis del emisor influye en la ga- 
nancia en una relación lineal. ¿Cuál variable regre- 
sora es el mejor predictor de la ganancia? 


11.37 Ер los pesticidas se utilizan compuestos de or- 
ganofosfatos (OF). Sin embargo, es importante estudiar 
el efecto que tienen sobre las especies expuestas a 
ellos. Como parte del estudio de laboratorio Some 
Effects of Organophosphate Pesticides on Wildlife Spe- 
cies, elaborado por el Departamento de Pesca y Vida 
Silvestre de Virginia Tech, se realizó un experimento en 
el cual se suministraron distintas dosis de un pesticida 
de OF específico a 5 grupos de 5 ratones (peromysius 
leucopus). Los 25 ratones eran hembras de edad y con- 
diciones similares. Un grupo no recibió el producto. La 
respuesta básica y consistió en medir la actividad cere- 
bral. Se postuló que dicha actividad disminuiría con un 
incremento en la dosis de OF. A continuación se pre- 
sentan los datos: 


| Dosis, x (mg/kg Actividad, y 
Animal de peso corporal) (moles/litro/min) 
1 0.0 10.9 
2 0.0 10.6 
3 0.0 10.8 
4 0.0 9.8 
5 0.0 9.0 
6 2.3 11.0 
7 2.3 11.3 
8 2.3 9.9 
9 2.3 9.2 
10 2.3 10.1 
11 4.6 10.6 
12 4.6 10.4 
13 4.6 8.8 
14 4.6 11.1 
15 4.6 8.4 
16 9:2 9.7 
17 9.2 7.8 
18 9:2 9.0 
19 9.2 8.2 
20 9.2 2.3 
21 18.4 2.9 
22 18.4 2.2 
23 18.4 3.4 
24 18.4 5.4 
25 18.4 8.2 


Ejercicios 


a) Con el modelo 


Y = B, + BX, + €, L= 1, 2:20, 
calcule los estimados de los mínimos cuadrados 
de B, y Ê, 

b) Construya una tabla de análisis de varianza en la 
cual aparezcan por separado el error puro y el 
error por falta de ajuste. Determine si la falta de 
ajuste es significativa al nivel de 0.05. Interprete 
los resultados. 


11.38 Es frecuente que se utilice el tratamiento con 
calor para carburar partes metálicas como los engranes. 
El espesor de la capa carburada se considera una carac- 
terística importante del engrane que contribuye a la 
confiabilidad general de la parte. Debido a la naturaleza 
crítica de esta característica, se realiza una prueba de 
laboratorio para cada lote del horno. La prueba es des- 
tructiva, ya que una parte real se corta en forma transver- 
sal y se sumerge en un producto químico durante cierto 
tiempo. Esta prueba requiere que se efectúe un análisis 
del carbono sobre la superficie, tanto de la parte supe- 
rior del engrane (arriba de los dientes) como de su raíz 
(entre los dientes). Los datos siguientes son los resulta- 
dos de la prueba de análisis de carbono en 19 partes. 


Tiempo Tiempo 

de inmersión Grado de inmersión Grado 
0.58 0.013 1.17 0.021 
0.66 0.016 1.17 0.019 
0.66 0.015 1.17 0.021 
0.66 0.016 1.20 0.025 
0.66 0.015 2.00 0.025 
0.66 0.016 2.00 0.026 
1.00 0.014 2.20 0.024 
1.17 0.021 2.20 0.025 
1.17 0.018 2.20 0.024 
1.17 0.019 


a) Ajuste una regresión lineal simple que relacione el 
grado del análisis de carbono y en comparación 
con el tiempo de inmersión. Pruebe Н: 8, = 0. 

b) Si se rechaza la hipótesis del inciso a, determine si 
el modelo lineal es adecuado. 


11.39 Se desea obtener un modelo de regresión que 
relacione la temperatura con la proporción de impure- 
zas de una sustancia que pasa a través de helio sólido. 
Se lista la temperatura en grados centígrados. A conti- 
nuación se presentan los datos. 


Temperatura (°C) Proporción de impurezas 


—260.5 0.425 
29957 0.224 
—264.6 0.453 
—265.0 0.475 
—270.0 0.705 
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—272.0 0.860 
—272.5 0.935 
—272.6 0.961 
—272.8 0.979 
—272.9 0.990 


а) Ajuste un modelo de regresión lineal. 

b) ¿Parece que la proporción de impurezas que pasan 
a través del helio aumenta a medida que la tempe- 
ratura se acerca a -273 grados centígrados? 

c) Calcule R?. 

d) Con base en la información anterior, ¿parece ade- 
cuado el modelo lineal? ¿Qué información adicio- 
nal necesitaría usted para responder mejor a la 
pregunta? 


11.40 Existe interés por estudiar el efecto que tiene el 
tamaño de la población de varias ciudades de Estados 
Unidos sobre las concentraciones de ozono. Los datos 
consisten en la población de 1999 en millones de habi- 
tantes y en la cantidad de ozono presente por hora en 
partes por mil millones (ppmm). Los datos son los si- 
guientes: 


Ozono (ppmm/hora), y Población, x 
126 0.6 
135 4.9 
124 0.2 
128 0.5 
130 1.1 
128 0.1 
126 1.1 
128 2.3 
128 0.6 
129 2.3 


a) Ajuste un modelo de regresión lineal que relacione 
la concentración de ozono con la población. Prue- 
be Н: В, = 0 usando el método ANOVA. 

b) Haga una prueba para la falta de ajuste. Con base 
en los resultados de la prueba, ¿es apropiado el 
modelo lineal? 

c) Pruebe la hipótesis del inciso a) utilizando el cua- 
drado medio del error puro en la prueba F. ¿Cam- 
bian los resultados? Comente las ventajas de cada 
prueba. 


11.41 Evaluar la deposición del nitrógeno de la at- 
mósfera es una tarea importante del National Atmos- 
pheric Deposition Program (NADP), que está asociado 
con muchas instituciones. Este programa está estudian- 
do la deposición atmosférica y su efecto sobre los cul- 
tivos agrícolas, las aguas superficiales de los bosques y 
otros recursos. Los óxidos del nitrógeno pueden tener 
efectos sobre el ozono atmosférico y la cantidad de ni- 
trógeno puro que se encuentra en el aire que respira- 
mos. Los datos son los siguientes: 
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Año Óxido de nitrógeno a) Grafique los datos. 

1978 0.73 b) Ajuste un modelo de regresión lineal y calcule R?. 
1979 2.55 c) ¿Qué puede decir acerca de la tendencia del óxido 
os i de nitrógeno con el paso del tiempo? 

1982 2,53 11.42 Para una variedad particular de planta los in- 
1983 277 vestigadores desean desarrollar una fórmula para pre- 
1984 3.93 decir la cantidad de semillas (en gramos) como una 
1985 2.03 función de la densidad de las plantas. Efectuaron un 
1986 4.39 estudio con cuatro niveles del factor x, el número de 
1987 3.04 plantas por parcela. Se utilizaron cuatro réplicas para 
1988 3.41 cada nivel de x. A continuación se muestran los datos: 
1989 5.07 

1990 3.95 Plantas por parcela, Cantidad de semillas, 
1991 3.14 х y (gramos) 

бз 10 126 110 121 109 
1994 4.50 20 153 16.1 149 15.6 
1995 3.95 30 179 18.3 18.6 17.8 
1996 524 40 192 19.6 18.9 200 
o. a ¿Es adecuado un modelo de regresión lineal simple 
1999 333 para analizar este conjunto de datos? 


11.10 Gráficas de datos y transformaciones 


En este capítulo se estudia la construcción de modelos de regresión en los que hay una 
variable independiente o regresora. Además, se supone que durante la construcción del 
modelo tanto x como y entran en el modelo en forma lineal. Con frecuencia es aconseja- 
ble trabajar con un modelo alternativo en el que x o y (o ambas) intervengan en una 
forma no lineal. Se podría recomendar una transformación de los datos debido a consi- 
deraciones teóricas inherentes al estudio científico, o bien, una simple graficación de los 
datos podría sugerir la necesidad de reexpresar las variables en el modelo. La necesidad 
de llevar a cabo una transformación es muy fácil de diagnosticar en el caso de la regre- 
sión lineal simple, ya que las gráficas en dos dimensiones brindan un panorama verda- 
dero de la manera en que las variables se comportan en el modelo. 

Un modelo en el que x o y se transforman no debería considerarse como un modelo 
de regresión no lineal. Por lo general denominamos a un modelo de regresión como li- 
neal cuando es lineal en los parámetros. En otras palabras, suponga que el aspecto de 
los datos u otra información científica sugiere que debe hacerse la regresión de y* en 
comparación con la de x*, donde cada una de ellas es una transformación de las varia- 
bles naturales x y y. Entonces, el modelo de la forma 


уѓ = Во + Віхѓ + є 


es lineal porque lo es en los parámetros 8, у 8,. El material que se estudió en las seccio- 
nes 11.2 a 11.9 permanece sin cambio, donde y? у х reemplazan a y, y х„ Un ejemplo 
sencillo y útil es el modelo log-log: 


log y; = Bo +6 log x; + Ej. 
Aunque este modelo es no lineal en x y y, sí lo es en los parámetros y por ello recibe el 


tratamiento de un modelo lineal. Por otro lado, un ejemplo de modelo verdaderamente 
no lineal es: 
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у = Po + Bix? +, 


donde se debe estimar el parámetro 8, así como 6, y В,. El modelo es no lineal en 6,. 

Las transformaciones susceptibles de mejorar el ajuste y la capacidad de predicción 
de un modelo son muy numerosas. Para un análisis completo de las transformaciones el 
lector podría consultar a Myers (1990, véase la bibliografía). Decidimos incluir aquí al- 
gunas de ellas y mostrar la apariencia de las gráficas que sirven como herramientas 
diagnósticas. Considere la tabla 11.6, donde se presentan varias funciones que describen 
relaciones entre y y x que pueden producir una regresión lineal por medio de la transfor- 
mación indicada. Además, en aras de que el análisis sea más exhaustivo, se presentan al 
lector las variables dependiente e independiente que se utilizan en la regresión lineal 
simple resultante. La figura 11.19 ilustra las funciones que se listan en la tabla 11.6, las 
cuales sirven como guía para el analista en la elección de una transformación a partir de 
la observación de la gráfica de y contra x. 


Tabla 11.6: Algunas transformaciones útiles para linealizar 


Forma funcional Transformación Forma de la regresión 
que relaciona y con x propia lineal simple 
Exponencial: у = Воеб!“ y*= In y Hacer la regresión de y* contra x 
Potencia: у = Box®" y* = log у; х* = 106 х Hacer la regresión de y* contra x* 
Recíproca: у = + 81 (2) х = 1 Hacer Ја regresión de у contra x* 
Hiperbólica: y = TEE y* = 5; х= 1 Hacer la regresión de Ё* contra x* 
y y И 
бай E 
Bo 
B1<0 0< Ву< 1 


X 


b) Función de potencia 


c) Función recíproca d) Función hiperbólica 


Figura 11.19: Diagramas que ilustran las funciones listadas en la tabla 11.6. 
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¿Cuáles son las implicaciones de un modelo transformado? 


Lo que sigue intenta ser una ayuda para el analista cuando es evidente que una transfor- 
mación producirá una mejoría. Sin embargo, antes de dar un ejemplo hay que mencionar 
dos puntos importantes. El primero tiene que ver con la escritura formal del modelo una 
vez que se hayan transformado los datos. Con mucha frecuencia el analista no piensa en 
esto y simplemente lleva a cabo la transformación sin preocuparse por la forma del mo- 
delo antes ni después de la transformación. El modelo exponencial sirve como una buena 
ilustración de esto. El modelo en las variables naturales (no transformadas) que produce 
un modelo de error aditivo en las variables transformadas es dado por 


у = Baer". є, 
que es un modelo de error multiplicativo. Al aplicar logaritmos es claro que se obtiene 
In у; = In Po + Bix; + ln є. 


Como resultado, las suposiciones básicas se efectúan sobre In є. El propósito de esta 
presentación sólo es recordar al lector que no debemos considerar una transformación 
tan sólo como una manipulación algebraica a la cual se suma un error. Con frecuencia, 
un modelo en las variables transformadas que tiene una adecuada estructura de error 
aditivo es resultado de un modelo en las variables naturales con un tipo de estructura de 
error diferente. 

El segundo aspecto importante se refiere a la noción de las medidas de mejoría. Las 
medidas evidentes de comparación son, por supuesto, el valor de R? y el cuadrado medio 
de los residuales s?. (En el capítulo 12 se estudian otras medidas de rendimiento que se 
usan para comparar modelos que compiten). Ahora, si la respuesta y no se transforma, 
entonces es claro que s? y R? se pueden usar para medir la utilidad de la transformación. 
Los residuales estarán en las mismas unidades para los dos modelos, el transformado y 
el que no se transformó. No obstante, cuando se transforma y los criterios de rendimien- 
to para el modelo transformado deberían basarse en los valores de los residuales en las 
unidades de medida de la respuesta no transformada. De esta manera las comparaciones 
son más apropiadas. El siguiente ejemplo proporciona una ilustración de lo anterior. 


Ejemplo 11.9: | Se registra la presión P de un gas que corresponde a distintos volúmenes V y los datos se 
presentan en la tabla 11.7. 


Tabla 11.7: Datos para el ejemplo 11.9 


V (ст?) 50 60 70 90 100 
P (kg/cm?) | 64.7 51.3 40.5 25.9 7.8 


La ley del gas ideal es dada por la forma funcional РУ? = C, donde y y C son cons- 
tantes. Estime las constantes C y 7. 
Solución: Se toman logaritmos naturales en ambos lados del modelo 


P¡VY=C-+e€, і= 1, 2,3, 4, 5. 
Como resultado, es posible escribir el modelo lineal 
ln P; = ln C — yln V; +e, і = 1,2,3,4,5, 
Donde e; = In e;. Los siguientes son los resultados de la regresión lineal simple: 


Intersección їп С = 14.7589, С = 2,568,862.88, Pendiente: % = 2.65347221. 
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La siguiente tabla representa información tomada del análisis de regresión. 


P; Vi In P; ln V; In P; P; e; = P; — Р; 
64.7 50 416976 3.91202 4.37853 79.7 —15.0 
51.3 60 3.93769 4.09434 3.89474 491 2:2 
40.5 70 370130 4.24850 3.48571 32.6 7.9 
25.9 90 3.25424 4.49981 2.81885 16.8 9.1 

7.8 100 2.05412 4.60517 2.53921 12.7 —4.9 


Resulta aleccionador graficar los datos y la ecuación de regresión. En la figura 11.20 
se presenta una gráfica de los datos no transformados de presión y volumen; en tanto que 
la curva representa la ecuación de regresión. 
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Figura 11.20: Datos de presión y volumen y la regresión ajustada. 


Gráficas de diagnóstico de los residuales: detección 
gráfica de la transgresión de las suposiciones 


Las gráficas de los datos brutos pueden ser muy útiles para determinar la naturaleza del 
modelo que debe ajustarse a ellos cuando sólo hay una variable independiente. En lo 
anterior tratamos de ilustrar esto. Sin embargo, la detección de la forma del modelo 
adecuado no es el único beneficio que se obtiene con la gráfica de diagnóstico. Como 
ocurre con gran parte del material asociado con las pruebas de hipótesis que se expone 
en el capítulo 10, los métodos de graficación ilustran y detectan la transgresión de las 
suposiciones. El lector debería recordar que muchos de los conceptos que se ilustran en 
este capítulo requieren suposiciones sobre los errores del modelo, las є. De hecho, su- 
ponemos que las e, son variables aleatorias independientes N(0, с). Por supuesto, las €, 
no se observan. Sin embargo, las e, = y, — 5, los residuales, corresponden al error en el 
ajuste de la recta de regresión, por lo que sirven para imitar a las €. Así, la apariencia 
general de estos residuales con frecuencia puede resaltar las dificultades. De manera 
ideal, por supuesto, la gráfica de los residuales es como la que se aprecia en la figura 11.21. 
Es decir, los residuales deberían demostrar en verdad fluctuaciones aleatorias alrededor 
del valor de cero. 
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Varianza no homogénea 


Una suposición importante que se hace en el análisis de regresión es la varianza homo- 
génea. A menudo las transgresiones se detectan mediante la apariencia de la gráfica de 
residuales. Es común que en los datos científicos se incremente la varianza del error con 
el aumento de la variable regresora. Una varianza grande del error produce residuales 
grandes y, por ende, una gráfica de residuales como la que se presenta en la figura 11.22 
es una señal de varianza no homogénea. En el capítulo 12, en el cual se expone la regre- 
sión lineal múltiple, se presenta un análisis más amplio acerca de las gráficas de los 
residuales e información acerca de los diferentes tipos de residuales. 


Residual 
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е 
1] 
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е 
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Figura 11.21: Gráfica ideal de los residuales. Figura 11.22: Gráfica de los residuales que 
ilustra una varianza heterogénea del error. 


Gráfica de la probabilidad normal 


La suposición de que los errores del modelo son normales se hace cuando el analista de 
los datos se ocupa de las pruebas de hipótesis o de la estimación de intervalos de confian- 
za. De nuevo, los equivalentes numéricos de los є„ es decir, los residuales, son sujetos de 
diagnóstico mediante la graficación para detectar cualesquiera transgresiones extremas. 
En el capítulo 8 se presentaron las gráficas normales cuantil-cuantil y se analizaron en 
forma breve las de probabilidad normal. En el estudio de caso que se presenta en la si- 
guiente sección se ilustran estas gráficas de residuales. 


11.11 Estudio de caso de regresión lineal simple 


En la fabricación de productos comerciales de madera es importante estimar la relación 
que hay entre la densidad de un producto de madera y su rigidez. Se está considerando 
un tipo relativamente nuevo de aglomerado que se puede formar con mucha mayor faci- 
lidad que el producto comercial ya aceptado. Es necesario saber a qué densidad su rigi- 
dez es comparable con la del producto comercial bien conocido y documentado. Terran- 
ce E. Conners realizó un estudio titulado Investigation of Certain Mechanical Properties 
of a Wood-Foam Composite (Tesis para el doctorado, Departamento de Bosques y Vida 
Silvestre, University of Massachusetts). Se produjeron 30 tableros de aglomerado con 
densidades que variaban aproximadamente de 8 a 26 libras por pie cúbico y se midió su 
rigidez en libras por pulgada cuadrada. En la tabla 11.8 se presentan los datos. 

Es necesario que el analista de datos se concentre en un ajuste apropiado para los 
datos y que utilice los métodos de inferencia que se estudian en este capítulo. Tal vez lo 
más apropiado sea una prueba de hipótesis sobre la pendiente de la regresión, así como 
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la estimación de los intervalos de confianza o de predicción. Se comenzará presentando 
un simple diagrama de dispersión de los datos brutos con una regresión lineal simple 
sobrepuesta. En la figura 11.23 se observa dicha gráfica. 

El ajuste de regresión lineal simple a los datos produce el modelo ajustado 


$ = —25,433.739 + 3884.976x (R? = 0.7975), 


Tabla 11.8: Densidad y rigidez de 30 tableros de aglomerado 


Densidad, x Rigidez, y Densidad, x Rigidez, y 
9.50 14,814.00 8.40 17,502.00 
9.80 14,007.00 11.00 19,443.00 
8.30 7573.00 9.90 14,191.00 
8.60 9714.00 6.40 8076.00 
7.00 5304.00 8.20 10,728.00 
17.40 43,243.00 15.00 25,319.00 
15.20 28,028.00 16.40 41,792.00 
16.70 49,499.00 15.40 25,312.00 
15.00 26,222.00 14.50 22,148.00 
14.80 26,751.00 13.60 18,036.00 
25.60 96,305.00 23.40 104,170.00 
24.40 72,594.00 23.30 49,512.00 
19.50 32,207.00 21.20 48,218.00 
22.80 70,453.00 21.70 47,661.00 
19.80 38,138.00 21.30 53,045.00 
110,000 40,000 
30,000 
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Figura 11.23: Diagrama de dispersión de los datos Figura 11.24: Gráfica de los residuales para los datos 
de densidad de la madera. de densidad de la madera. 


y se calcularon los residuales. En la figura 11.24 se presentan los residuales graficados 
contra las mediciones de la densidad. Difícilmente se trata de un conjunto de residuales 
ideal o satisfactorio, pues no muestran una distribución aleatoria alrededor del valor de 
cero. En realidad, los agrupamientos de valores positivos y negativos sugerirían que 
se debe investigar una tendencia curvilínea en los datos. 
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Para darnos una idea respecto a la suposición de error normal se dibujó una gráfica 
de probabilidad normal de los residuales. Es el tipo de gráfica que estudiamos en la sec- 
ción 8.8, donde el eje horizontal representa la función de distribución normal empírica 
en una escala que produce una gráfica con línea recta cuando se grafica contra los resi- 
duales. En la figura 11.25 se presenta la gráfica de probabilidad normal de los residuales. 
Esta gráfica no refleja la apariencia de recta que a uno le gustaría ver, lo cual es otro 
síntoma de una selección errónea, quizá sobresimplificada, de un modelo de regresión. 


40,000 
30,000 
20,000 


10,000 


Cuantil residual 


—10,000 


2008 =2 =1 0 1 2 


Cuantil normal estándar 


Figura 11.25: Gráfica de probabilidad normal de los residuales para los datos 
de densidad de la madera. 


Los dos tipos de gráficas de residuales y, de hecho, el propio diagrama de disper- 
sión, sugieren que sería adecuado un modelo algo más complicado. Una posibilidad es 
usar un modelo con transformación de logaritmos naturales. En otras palabras, hay que 
elegir hacer la regresión de In y contra x. Esto produce la regresión 


Iny = 8 .257+ 0.125х (R? = 0.9016). 


Para darse una idea de si el modelo transformado es más apropiado considere las figu- 
ras 11.26 y 11.27, que muestran las gráficas de los residuales de la rigidez [es decir, у- 


antilog (їп у) en comparación con las de la densidad. La figura 11.26 parece más cer- 
cana a un patrón aleatorio alrededor del cero, en tanto que la figura 11.27 con seguridad 
se acerca más a una línea recta. Esto, además de un valor de R? más elevado, sugeriría 
que el modelo transformado es más apropiado. 


Correlación 


Hasta este momento se ha supuesto que la variable regresora independiente x es una 
variable científica o física en lugar de una variable aleatoria. De hecho, en este contexto 
es frecuente que x se denomine variable matemática, la cual, en el proceso de muestreo, 
se mide con un error despreciable. En muchas aplicaciones de las técnicas de regresión 
es más realista suponer que tanto X como Y son variables aleatorias y que las mediciones 
{(х:,у:); 1 = 1,2,...,n) son observaciones de una población que tiene la función de 
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Figura 11.26: Gráfica de residuales donde se 
utiliza una transformación logarítmica para los 
datos de densidad de la madera. 
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0.6 


0.3 


Cuantil residual 


—0.3 


=2 = 0 1 2 
Cuantil normal estándar 
Figura 11.27: Gráfica de probabilidad normal de 
residuales en la cual se utiliza una transformación 
logarítmica para los datos de densidad de la 
madera. 


densidad conjunta f(x, y). Debemos considerar el problema de medir la relación entre 
las dos variables X y Y. Por ejemplo, si X y Y representaran la longitud y la circunferencia 
de una clase particular de hueso en el cuerpo de un adulto, podríamos realizar un estudio 
antropológico para determinar si los valores grandes de X se asocian con valores grandes 


de Y, y viceversa. 


Por otro lado, si X representa la antigüedad de un automóvil usado y Y representa su 
precio de lista al menudeo, se esperaría que los valores grandes de X correspondan a 
valores pequeños de Y y que los valores pequeños de X correspondan a valores grandes 
de Y. El análisis de correlación intenta medir la fuerza de tales relaciones entre dos 
variables por medio de un solo número denominado coeficiente de correlación. 

En teoría, con frecuencia se supone que la distribución condicional A(y|x) de Y, para 


2 


| 4 £ б 2 
valores fijos de X, es normal con media My; = B, + Bx y varianza O ур E a”, y que, de 
igual manera, X se distribuye de forma normal con media u y varianza O. Entonces, la 


densidad conjunta de X y Y es 


fœ у) = п(у|х; Во + 81% о)п(х; UA Ox) 


1 


270,0 


e. (аа) „(с | 
2 с Ох 


para —oo< <оо y —оо< у «оо. 


Escribamos la variable aleatoria Y en la forma 


4 = Bo + PX FE 


donde ahora X es una variable aleatoria independiente del error aleatorio €. Como la 
media del error aleatorio € es cero, se deduce que 


Hry =%+Йих y оў =P + Вїох. 


Al sustituir para о y о? en la expresión anterior para f(x, y), se obtiene la distribución 


normal bivariada 
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1 х = Hx \ x = Их Y (Y HY У = Ну Ya 
ll Ox )-20( ох | оү )+( Oy y) 


рага —oo<x<ooy=—0o0< y <œ, donde 


с с 
2 2Ох 
ё =1— = = 892. 

Y Сү 


La constante р (ro) se denomina coeficiente de correlación de la población у desempe- 
ña un papel importante en muchos problemas de análisis de datos bivariados. Es impor- 
tante que el lector entienda la interpretación física de este coeficiente de correlación, así 
como la diferencia entre correlación y regresión. El e regresión aún tiene algún 
significado aquí. De hecho, la línea recta dada por p, o + Вх se sigue llamando 
recta de regresión, igual que antes, y los estimadores dep B, | `8, son idénticos a los que 
se presentaron en la sección 11.3. El valor de p es O cuando В, = 0, que resulta cuando 
en esencia no existe regresión lineal; es decir, cuando la recta de regresión es horizontal 
y cualquier conocimiento de X es inútil para predecir Y. Como ту >0”, se debe tener 
P < 1 y, por lo tanto, -1 < p < 1. Los valores de p +1 sólo ocurren cuando o° = 0, en 
cuyo caso se tiene una relación lineal perfecta entre las dos variables. Así, un valor de p 
igual a +1 implica una relación lineal perfecta con pendiente positiva, en tanto que un 
valor de p igual a —1 resulta de una relación lineal perfecta con pendiente negativa. En- 
tonces, se podría decir que los estimadores muestrales de p con magnitud cercana a la 
unidad implican una buena correlación o asociación lineal entre X y Y, mientras que 
valores cercanos a cero indican poca o ninguna correlación. 

Para obtener un estimador muestral de p recordemos que en la sección 11.4 apren- 
dimos que la suma de los cuadrados del error es 

SCE =S yy —b18 y . 


Al dividir ambos lados de esta ecuación entre Ss, y reemplazar $ „ con b 15, „ә Se obtiene la 


relación 
p? Se _ Е SCE 
1 — . 
$ уу $ уу 


El valor de bíS,, / S,, es igual a cero cuando b, = 0, lo que ocurrirá cuando los puntos 
muestrales no tengan relación lineal. Como S., > SCE, se concluye que руб. y debe 


estar entre O y 1. En consecuencia, b,,/S.. / 5, debe variar entre —1 y +1, у los valores 
negativos corresponden a rectas con pendientes negativas, mientras que los valores posi- 
tivos corresponden a rectas con pendientes positivas. Un valor de—1 o +1 sucederá cuando 
SCE = 0, pero éste es el caso en el que todos los puntos muestrales caen sobre una línea 
recta. Por lo tanto, una relación lineal perfecta se da en los datos muestrales cuando 
b,,/S.. / S,, = +1. Es claro que la cantidad b,,/S., / $ ‚1а cual se designará de aquí en 
adelante como r, se puede usar como un estimado del coeficiente de correlación p de la 
población. Se acostumbra hacer referencia al estimado r como coeficiente de correlación 
producto-momento de Pearson, o sólo como coeficiente de correlación muestral. 


Coeficiente de La medida p de la asociación lineal entre dos variables X y Y se estima por medio del 
correlación coeficiente de correlación muestral z, donde 


11.12 Correlación 
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Hay que tener cuidado en la interpretación de valores de r entre —1 y +1. Por ejem- 
plo, valores de r iguales a 0.3 y 0.6 significan sólo que hay dos correlaciones positivas, 
una un poco más fuerte que la otra. Sería un error concluir que r = 0.6 indica una rela- 
ción lineal dos veces mejor que la del valor r = 0.3. Por otro lado, si escribimos 


2 Si _ SCR 
$ хх S yy $ уу | 


entonces r?, que por lo general se denomina coeficiente muestral de determinación, re- 
presenta la proporción de la variación de 5 explicada por la regresión de Y sobre x, a saber, 
la SCR. Es decir, г? expresa la proporción de la variación total de los valores de la varia- 
ble Y que son ocasionados o explicados por una relación lineal con los valores de la variable 
aleatoria X. Así, una correlación de 0.6 significa que 0.36, o 36%, de la variación total de 
los valores de Y en la muestra se explica mediante la relación lineal con los valores de X. 


Ejemplo 11.10: | Es importante que los investigadores científicos del área de productos forestales sean 


capaces de estudiar la correlación entre la anatomía y las propiedades mecánicas de los 
árboles. Para el estudio Quantitative Anatomical Characteristics of Plantation Grown 
Loblolly Pine (Pinus Taeda L.) and Cottonwood (Populus deltoides Bart. Ex Marsh.) 
and Their Relationships to Mechanical Properties, realizado por el Departamento de 
Bosques y Productos Forestales de Virginia Tech, se seleccionaron al azar 29 pinos 
de Arkansas para investigarlos. En la tabla 11.9 se presentan los datos resultantes sobre 
la gravedad específica en gramos/cm? y el módulo de ruptura en kilopascales (kPa). 
Calcule e interprete el coeficiente de correlación muestral. 


Tabla 11.9: Datos de 29 pinos de Arkansas para el ejemplo 11.10 


Gravedad específica, Módulo de ruptura, Gravedad específica, Módulo de ruptura, 

х (в/с?) у (КРа) х (g/cm?) у (КРа) 
0.414 29,186 0.581 85,156 
0.383 29,266 0.557 69,571 
0.399 26,215 0.550 84,160 
0.402 30,162 0.531 73,466 
0.442 38,867 0.550 78,610 
0.422 37,831 0.556 67,657 
0.466 44,576 0.523 74,017 
0.500 46,097 0.602 87,291 
0.514 59,698 0.569 86,836 
0.530 67,705 0.544 82,540 
0.569 66,088 0.557 81,699 
0.558 78,486 0.530 82,096 
0.577 89,869 0.547 75,657 
0.572 77,369 0.585 80,490 
0.548 67,095 
Solución: A partir de los datos se encuentra que 


Sy = 0.11273, Syy = 11,807,324,805, Sw = 34,422.27572. 


Por lo tanto, 


34,422.27572 


r= = 0.9435. 
„/0.11273)(11,807,324,805) 
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Un coeficiente de correlación de 0.9435 indica una buena relación lineal entre X y Y. 
Como r? = 0.8902, se puede decir que aproximadamente 89% de la variación de los 
valores de Y es ocasionada por una relación lineal con X. 

Una prueba de la hipótesis especial p = О en comparación con una alternativa apro- 
piada es equivalente a probar 8, = O para el modelo de regresión lineal simple y, por 
lo tanto, son aplicables los procedimientos de la sección 11.8, donde se usaba la distri- 
bución £ con n — 2 grados de libertad o la distribución F con 1 y n — 2 grados de libertad. 
Sin embargo, si se desea evitar el procedimiento del análisis de varianza y tan sólo 
calcular el coeficiente de correlación muestral, se podría verificar (véase el ejercicio de 
repaso 11.66 en la página 438) que el valor £ 


también se puede escribir como 


TETA 


que, como antes, es un valor del estadístico Т que tiene una distribución £ con n — 2 gra- 
dos de libertad. 


Ejemplo 11.11: | Para los datos del ejemplo 11.10 pruebe la hipótesis de que no existe asociación lineal 


Solución: 


entre las variables. 
1. Н:р = 0. 


. Cálculos: t = 05 т =4/4.79, Р #51.0001. 


. Decisión: Rechazar la hipótesis de que no existe asociación lineal. JJ 

A partir de la información muestral es fácil efectuar una prueba de la hipótesis más 

general de que p = p, en comparación con una hipótesis alternativa adecuada. Si X y Y 
siguen una distribución normal bivariada, la cantidad 


2 
3 
4. Región crítica: t < —2.052 o t > 2.052. 
5 
6 


es el valor de una variable aleatoria que sigue aproximadamente la distribución normal 


con media 1-1 y y varianza 1 /(п – 3). Entonces, el procedimiento de prueba consiste 
en calcular 
с2а In l+r lá 1+ ро 2 а (1@)(1 — po) 
2 1—г 1—0 2 (1—г)(1@ po) 


y compararlo con los puntos críticos de la distribución normal estándar. 


Ejemplo 11.12: | Para los datos del ejemplo 11.10 pruebe la hipótesis nula de que p = 0.9 en comparación 


Solución: 


con la alternativa de que p > 0.9. Utilice un nivel de significancia de 0.05. 
1. Нур = 0.9. 

2. Н: р > 0.9. 

3. а = 0.05. 

4. Región crítica: z > 1.645. 
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a) Sin asociación b) Relación causal 


Figura 11.28: Diagrama de dispersión que muestra correlación de cero. 


5. Cálculos: 


_ 126, [0 29.94350.) 


=4.51, P =49.0655. 
2 "|a 9.94359) 


6. Decisión: Existe con certeza alguna evidencia de que el coeficiente de correlación no 
excede a 0.9. J 
Debe precisarse que en los estudios de correlación, como en los problemas de regre- 
sión lineal, los resultados obtenidos sólo son tan buenos como el modelo que se adopte. 
En las técnicas de correlación estudiadas aquí se supone que las variables X y Y tienen 
una densidad normal bivariada, con el valor medio de Y para cada valor de x relacionado 
en forma lineal con x. Con frecuencia es útil elaborar una gráfica preliminar de los datos 
experimentales para observar qué tan adecuada es la suposición de linealidad. Un valor 
del coeficiente de correlación muestral cercano a cero resultará de datos que muestren un 
efecto estrictamente aleatorio, como los de la figura 11.28a, lo que implica que hay poca 
о ninguna relación causal. Es importante recordar que el coeficiente de correlación entre 
dos variables es una medida de su relación lineal, у que un valor de r = 0 implica falta 
de linealidad y no falta de asociación. Por lo tanto, si existiera una relación cuadrática 
fuerte entre X у Y, como la que se observa en la figura 11.28, aún se podría obtener una 
correlación de cero que indicaría una relación no lineal. 


Ejercicios 


11.43 Calcule e interprete el coeficiente de correla- 11.44 Remítase al ejercicio 11.1 de la página 398 у 
ción para las siguientes calificaciones de 6 estudiantes suponga que x y y son variables aleatorias con una dis- 


seleccionados al azar: tribución normal bivariada: 
. ре а) Calcule г. 
Calificación b) Pruebe la hipótesis de que p = 0 en comparación 
en matemáticas | 4 65 83 


- con la alternativa de que p + O a un nivel de signi- 


70 92 80 7 
Calificación en inglésl 74 84 63 87 78 90 ficancia de 0.05. 
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11.45 Remítase al ejercicio 11.13 de la página 400, 
suponga una distribución normal bivariada para x y y. 

a) Calcule r. 

b) Pruebe la hipótesis nula de que p = – 0.5, en com- 
paración con la alternativa de que p < –0.5, a un 
nivel de significancia de 0.025. 

c) Determine el porcentaje de la variación en la can- 
tidad de partículas eliminadas que se debe a cam- 
bios en la cantidad de lluvia diaria. 


11.46 Enel ejercicio 11.43 pruebe la hipótesis de que 
р = О en comparación con la alternativa de que p F 0. 
Utilice un nivel de significancia de 0.05. 


11.47 Los datos siguientes se obtuvieron en un estu- 
dio de la relación entre el peso y el tamaño del pecho de 
niños al momento de nacer. 


Ejercicios de repaso 


11.48 Remítase al ejercicio 11.8 de la página 399 y 
construya 
a) un intervalo de confianza de 95% para la califica- 
ción promedio en el curso de los estudiantes que 
obtuvieron 35 puntos en el examen de colocación; 
b) un intervalo de predicción de 95% para la califica- 
ción del curso de un estudiante que obtuvo 35 pun- 
tos en el examen de colocación. 


11.49 El Centro de Consulta Estadística de Virginia 
Tech analizó datos sobre las marmotas normales para el 
Departamento de Veterinaria. Las variables de interés 
fueron el peso corporal en gramos y el peso del corazón 
en gramos. Se deseaba desarrollar una ecuación de re- 
gresión lineal con el fin de determinar si había una 
relación lineal significativa entre el peso del corazón y 
el peso total del cuerpo. 


Peso corporal (gramos) Peso del corazón (gramos) 


4050 11.2 
2465 
3120 
5700 
2595 
3640 
2050 
4235 
2935 
4975 
3690 
2800 
2775 
2170 
2370 
2055 
2025 
2645 
2675 
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Peso (kg) Tamaño del pecho (cm) 


213 29.5 
2.15 26.3 
4.41 32.2 
5:52 36.5 
3.21 27.2 
4.32 27.7 
2.31 28.3 
4.30 30.3 
3.71 28.7 


a) Calcule r. 

b) Pruebe la hipótesis nula de que p = О en compara- 
ción con la alternativa de que p > 0 a un nivel de 
significancia de 0.01. 

c) ¿Qué porcentaje de la variación del tamaño del pecho 
de los niños es explicado por la diferencia de peso? 


Utilice el peso del corazón como la variable indepen- 
diente, el peso del cuerpo como la dependiente y haga 
un ajuste de regresión lineal simple con los siguientes 
datos. Además, pruebe la hipótesis de que Н: 8, = Оеп 
comparación con Н: 8, # 0. Saque conclusiones. 


11.50 A continuación se presentan las cantidades de 
sólidos eliminados de cierto material cuando se expone 
a periodos de secado de diferentes duraciones. 


x (horas) y (gramos) 
4.4 13.1 142 
4.5 90 11.5 
4.8 10.4 11.5 
5.5 13.8 14.8 
9.7 127 15.1 
5.9 9.9 127 
6.3 13.8 16.5 
6.9 164 15.7 
7.5 17.6 16.9 
7.8 18.3 17.2 


а) Estime la recta de regresión lineal. 
b) Pruebe si es adecuado el modelo lineal a un nivel 
de significancia de 0.05. 


11.51 Remítase al ejercicio 11.9 de la página 399 y 
construya 
a) un intervalo de confianza de 95% para las ventas 
semanales promedio cuando se gastan $45 en pu- 
blicidad. 
b) un intervalo de predicción de 95% para las ventas 
semanales cuando se gastan $45 en publicidad. 


11.52 Se diseñó un experimento рага el Departamen- 
to de Ingeniería de Materiales de Virginia Tech con el 
fin de estudiar las propiedades de deterioro del nitróge- 
no con base en las mediciones de la presión de hidrógeno 


Ejercicios de repaso 


electrolítico. Se utilizó una solución al 0.1 N NaOH y 
el material era cierto tipo de acero inoxidable. La den- 
sidad de corriente de carga catódica fue controlada y 
variada en cuatro niveles. Se observó la presión de hi- 
drógeno efectiva como la respuesta. A continuación se 
presentan los datos. 


Densidad de Presión de 
corriente de hidrógeno 
Ensayo carga, х (mA/cm?) efectiva, y (atm) 
1 0.5 86.1 
2 0.5 92.1 
3 0.5 64.7 
4 0.5 74.7 
Э 1.5 223.6 
6 1:5 202.1 
7 1.5 132.9 
8 2.3 413.5 
9 2.5 231.5 
10 2.9 466.7 
11 2.5 365.3 
12 3.9 493.7 
13 3.5 382.3 
14 3.5 447.2 
15 3.5 563.8 
a) Efectúe un análisis de regresión lineal simple de y 
con x. 


b) Calcule la suma de cuadrados del error puro y 
haga una prueba para la falta de ajuste. 

c) ¿La información del inciso b indica la necesidad 
de un modelo en x más allá de una regresión de 
primer orden? Explique su respuesta. 


11.53 Los datos siguientes representan la calificación 
en química de una muestra aleatoria de 12 estudiantes 
de nuevo ingreso a cierta universidad, así como sus ca- 
lificaciones en una prueba de inteligencia aplicada 
mientras estudiaban el último año de preparatoria. 
Calificación Calificación en 


Estudiante ер la prueba,x química, y 
1 65 85 
2 50 74 
3 55 76 
4 65 90 
5 29 85 
6 70 87 
7 65 94 
8 70 98 
9 ЭЭ 81 

10 70 91 
11 50 76 
12 55 74 


a) Calcule e interprete el coeficiente de correlación 
de la muestra. 

b) Establezca las suposiciones necesarias acerca de 
las variables aleatorias. 
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c) Pruebe la hipótesis de que p = 0.5 en comparación 
con la alternativa de que p > 0.5. Use un valor P 
para las conclusiones. 


11.54 La sección de negocios del Washington Times 
de marzo de 1997 listaba 21 diferentes computadoras e 
Impresoras usadas, así como sus precios de lista. Tam- 
bién se listaba la oferta promedio. En la figura 11.29 de 
la página 439 se presenta una parte de los resultados 
impresos por computadora del análisis de regresión 
usando el programa SAS. 
a) Explique la diferencia entre el intervalo de con- 
fianza sobre la media y el intervalo de predicción. 
b) Explique por qué los errores estándar de la predic- 
ción varían de una observación a otra. 
с) ¿Cuál observación tiene el menor error estándar de 
la predicción? Explique su respuesta. 


11.55 Considere los datos de los vehículos de Consu- 
mer Reports que se incluyen en la figura 11.30 de la 
página 440. El peso se indica en toneladas, el rendi- 
miento en millas por galón y también se incluye el co- 
ciente de manejo. Se ajustó un modelo de regresión que 
relaciona el peso x con el rendimiento y. En la figura 
11.30 de la página 440 se observa una salida parcial del 
SAS con los resultados de dicho análisis de regresión, y 
en la figura 11.31 de la página 441 se incluye una grá- 
fica de los residuales y el peso de cada vehículo. 

a) A partir del análisis y la gráfica de los residuales, 
¿se podría concluir que cabría la posibilidad de 
encontrar un modelo mejorado si se usara una 
transformación? Explique su respuesta. 

b) Ajuste el modelo reemplazando el peso con el lo- 
garitmo del peso. Comente los resultados. 

c) Ajuste un modelo reemplazando mpg con los galo- 
nes por cada 100 millas recorridas, como se reporta 
con frecuencia el rendimiento del combustible en 
otros países. ¿Cuál de los tres modelos es preferi- 
ble? Explique su respuesta. 


11.56 A continuación se presentan las observaciones 
registradas del producto de una reacción química toma- 
das a temperaturas diferentes: 


х СС) у (0) | x (С) у (%) 
150 75.4 150 777 
150 81.2 200 84.4 
200 85.5 200 85.7 
250 89.0 250 89.4 
250 90.5 300 94.8 
300 96.7 300 95.3 


а) Grafique los datos. 

b) ¿La gráfica indica que la relación es lineal? 

c) Haga un análisis de regresión lineal simple y prue- 
be la falta de ajuste. 
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d) Saque conclusiones con base en el resultado del 
inciso с. 


11.57 La prueba de acondicionamiento físico es un as- 
pecto importante del entrenamiento atlético. Una medi- 
da común para determinar la aptitud cardiovascular es el 
volumen máximo de oxígeno que se inhala al realizar un 
ejercicio extenuante. Se realizó un estudio con 24 hom- 
bres de mediana edad para analizar cómo el tiempo que 
les tomaba correr una distancia de dos millas influía en 
el oxígeno que consumían, el cual se midió con métodos 
estándar de laboratorio mientras los sujetos se ejercita- 
ban en una banda sin fin. El trabajo fue publicado en el 
artículo “Maximal Oxygen Intake Prediction in Young 
and Middle Aged Males”, Journal of Sports Medicine 9, 
1969, 17-22. A continuación se presentan los datos. 


y, Volumen x, Tiempo 
Sujeto máximo de O, en segundos 

1 42.33 918 
53.10 805 

3 42.08 892 
4 50.06 962 
5 42.45 968 
6 42.46 907 
7 47.82 770 
8 49.92 743 
9 36.23 1045 
10 49.66 810 
11 41.49 927 
12 46.17 813 
13 46.18 858 
14 43.21 860 
15 51.81 760 
16 53.28 747 
17 53.29 743 
18 47.18 803 
19 56.91 683 
20 47.80 844 
21 48.65 755 
22 53.67 700 
23 60.62 748 
24 56.73 775 


a) Estime los parámetros еп un modelo de regresión 
lineal simple. 

b) ¿El tiempo que toma correr dos millas influye de 
forma significativa en la cantidad máxima de oxí- 
geno consumido? Utilice Н: 8, = 0 en compara- 
ción con HA: 8, F0. 

c) Grafique los residuales en una gráfica en compara- 
ción con x y haga comentarios sobre qué tan apro- 
piado es el modelo lineal simple. 


11.58 Suponga que cierto científico postula el modelo 
Y, =Po0+Pixi+e, 1=1,2,...,n, 
y 6, es un valor conocido no necesariamente igual a cero. 
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a) ¿Cuál es el estimador apropiado de mínimos cua- 
drados de 8? Justifique su respuesta. 
b) ¿Cuál es la varianza del estimador de la pendiente? 


11.59 Para el modelo de regresión lineal simple de- 
muestre que E(s?) = o°. 


11.60 Suponga que las e, son independientes y que se 
distribuyen normalmente con medias de cero y varianza 
común o°, y demuestre que В, el estimador de míni- 
mos cuadrados de 6, en ш, = B, + В ух, se distribuye 
de manera normal con media 6, y varianza 


Оз, =— ©. 


п Y (xi —Х)? 
і=1 
11.61 Рага un modelo de regresión lineal simple 


Y; = Во + Bixi +6, 1 =1,2,...,п, 


donde las €, son independientes y se distribuyen nor- 
malmente con medias de cero y varianzas iguales 07, 
demuestre que 


n 
y (xi = x) Y; 
i=l 
Bı = п Е 
Na; — х)? 
і=1 
y tienen covarianza de cero. 


11.62 Demuestre, en el caso de un ajuste de mínimos 
cuadrados al modelo de regresión lineal simple 


Ү = 8 + Bixi + éi, 


que > Qu —)Y:) => e = 0. 
= A 


їс= 1.2 as 


11.63 Considere la situación del ejercicio de repaso 
11.62 pero suponga que n = 2, es decir, que sólo dispo- 
nemos de dos puntos de datos. Argumente que la recta 
de regresión de mínimos cuadrados tendrá como resulta- 
do (y, = у) = (Y —Y,)= 0. También demuestre que para 
este caso R? = 1.0. 


11.64 Enel ejercicio de repaso 1 1.62 se pidió al estu- 

diante que demostrara que > (y; — $) = 0 para un 
і=1 

modelo de regresión lineal simple estándar. ¿Se cumple 


también para un modelo con intersección en el origen? 
Demuestre su respuesta, ya sea afirmativa o negativa. 
11.65 Suponga que un experimentador plantea un 
modelo como 
Y; =Pb+fxi+e6, 1=1,2,...,n, 

cuando en realidad una variable adicional, digamos x,, 
también contribuye linealmente a la respuesta. Enton- 
ces, el verdadero modelo es dado por 

Ү = bo + Pix + 8х2: +e, Ё=1,2,...,п. 


Ejercicios de repaso 


Calcule el valor esperado del estimador 
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11.68 Proyecto: Este proyecto se puede realizar en 
grupos o de manera individual. Cada grupo o persona 
debe encontrar un grupo de datos, preferiblemente de 
su campo de estudios, aunque también pueden ser de otro 
campo. Los datos se deben ajustar al esquema de regre- 
sión, con una variable de regresión x y una variable de 


11.66 Demuestre los pasos necesarios para convertir respuesta y. Determine con cuidado cuál variable es x y 


la ecuación r= ЕЕ 98 a la forma equivalente Cuáles у. Tal vez necesite consultar una revista cientí- 

р 139-2. SIN Sa fica de su campo si no cuenta con otros datos experi- 
l-r? mentales. 

11.67 Considere el siguiente grupo ficticio de datos, a) Grafique y contra 5 Comente sobre la relación que 

donde la línea que los atraviesa representa la recta de se observa en la gráfica. 

regresión lineal simple ajustada. Grafique los residuales. b) Diseñe un modelo de regresión adecuado a partir 


de los datos. Utilice una regresión lineal simple o 
ajuste un modelo polinomial a los datos. Comente 
acerca de medidas de calidad. 


c) Grafique los residuales como se indica en el texto. 
Verifique posibles violaciones de los supuestos. 
Muestre de forma gráfica una representación de 
los intervalos de confianza de una respuesta media 
graficada en comparación con x. Haga comenta- 
rios al respecto. 


R-Square Coeff Var Root MSE PriceMean 
0.967472 7.923338 70.83841 894.0476 
Standard 

Parameter Estimate Error t Value Pr> |t| 
Intercept 59.93749137 38.34195754 1:56 0.1345 
Buyer 1.04731316 0.04405635 2317 <.0001 

PredictStd Err Lower 95% Upper 95% Lower 95% Upper 95% 
product Buyer Price Value Predict Mean Mean Predict Predict 
IBM PS/1 486/66420МВ 325 375 400.3125.8906 346.12 454.50 242.46 558.17 
IBM ThinkPad500 450 625 531.2321.7232 485.76 576.70 376.15 686.31 
IBM Think-Dad755CX 1700 18501840.3742.7041 1750.99 1929.75 1667.25 2013.49 
AST Pentium90 540MB 800 875 897.7915.4590 865.43 930.14 746.03 1049.54 
Dell Pentium75 1GB 650 700 740.6916.7503 705.63 715.75 588.34 893.05 
Gateway486/75320MB 700 750 793.0616.0314 759.50 826.61 641.04 945.07 
Clone 586/1331GB 500 600 583.5920.2363 541.24 625.95 429.40 737. 79 
CompagContura4/25 120MB 450 600 531.2321.7232 485.76 576.70 3765. 15 686.31 
CompagDeskproP90 1.2GB 800 850 897.7915.4590 865.43 930.14 746.03 1049.54 
MicronP75 810MB 800 675 897.7915.4590 865.43 930.14 746.03 1049.54 
MicronP100 1.2GB 900 975 1002.5216.1176 968.78 1036.25 850.46 1154.58 
Mac Quadra 840AV 500MB 450 575 531.2321.7232 485.76 576.70 376.15 686.31 
Mac Performer6116 700MB 700 775 793.0616.0314 759.50 826.61 641.04 945.07 
PowerBook540c 320MB 1400 15001526.1830.7579 1461.80 1590.55 1364.54 1687.82 
PowerBook5300 500MB 1350 1575 1473.8128.8747 1413.37 1534.25 1313.70 1633.92 
Power Mac 7500/1001GB 1150 1325 1264.3521.9454 1218.42 1310.28 1109.13 1419.57 
NEC Versa 486 340MB 800 900 897.7915.4590 865.43 930.14 746.03 1049.54 
Toshibal960CS320MB 700 825 793.0616.0314 759.50 826.61 641.04 945.07 
Toshiba4800VCT500MB 1000 11501107.2517.8715 1069.85 1144.66 954.34 1260.16 
HP Laserjet 111 350 475 426.5025.0157 374.14 478.86 269.26 583.74 
Apple Laser WriterPro 63 750 800 845.4215.5930 812.79 878.06 693.61 997.24 


Figura 11.29: Salida por computadora de los resultados del SAS que presenta el análisis parcial de datos 
del ejercicio de repaso 11.54. 
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Obs Model WT MPG DR_RATIO 
F Buick EstateWagon 4.360 16.9 2.73 
2 Ford CountrySquireWagon 4.054 15.5 2.26 
3 Chevy Ma libu Wagon 3.605 19.2 2.56 
4 ChryslerLeBaronWagon 3.940 18.5 2.45 
5 Chevette 2.155 30.0 370 
6 Toyota Corona 2.560 275 3.05 
7. Datsun510 2.300 27.2 3.54 
8 Dodge Omni 2.230 30.9 3.37 
9 Audi 5000 2.830 20.3 3.90 

10 Volvo 240 CL 3.140 17.0 3.50 
11 Saab 99 GLE 2.795 21.6 LAN 
12 Peugeot 694 SL 3.410 16.2 3.58 
13 Buick CenturySpecial 3.380 20.6 2:73 
14 ercuryZephyr 3.070 20.8 3.08 
15 Dodge Aspen 3.620 18.6 А 
16 АМС ConcordD/L 3.410 18-1 2.73 
17 Chevy CapriceClassic 3.840 17.0 2.41 
18 Ford LTP 3.725 17.6 2:20 
19 ercuryGrand Marquis 3.955 16.5 2.26 
20 Dodge St Regis 3.830 18.2 2.45 
21 Ford Mustang4 24585 26.5 3.08 
22 Ford MustangGhia 2.910 21.9 3.08 
23 Macda GLC 1.975 34.1 3.73 
24 Dodge Colt 1:915 IL 2097 
25 AMC Spirit 2.670 27.4 3.08 
26 VW Scirocco 1:990 ЗБ 3.78 
27 Honda Ассогах 2.135 29,5 3 05 
28 Buick Skylark 2.570 28.4 2.53 
29 Chevy Citation 2.595 28.8 2.69 
30 Olds Omega 2.700 26.8 2.84 
31 PontiacPhoenix 2.556 33.5 2.69 
32 P1ymouthHorizon 2.200 34.2 3.37 
33 Datsun210 2.020 31.8 3,70 
34 Fiat Strada 2.130 37.3 3.10 
35 VW Dasher 2.190 30.5 3.70 
36 Datsun810 2.815 22.0 3.70 
37 BMW 320i 2.600 21.5 3.64 
38 VW Rabbit 1.925 31.9 3.78 
R-Square Coeff Var Root MSE MPG Mean 
0.817244 11.46010 2.837580 24.76053 
Standard 

Parameter Estimate Error t Value Рг > |t| 

Intercept 48.67928080 1.94053995 25.09 <.0001 

WT -8.36243141 0.65908398 = 12.69 <.0001 


Figura 11.30: Salida de computadora de los resultados del SAS que muestra el análisis parcial de los datos 
del ejercicio de repaso 11.55. 
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Plot of Resid*WT. Symbolused is '*'. 
Resid 
8 + 
* * 
6 + 
ж 
4 + Ыы 
* 
ж 
2 + Ы 
ж * 
* 
* * ж 
* ж 
* * * 
O eii ¿AA A A A A A E A A Ыы ЕЗЕ 
ж ж ж ж 
ж 
= 5 * 
ж ж * 
* 
* 
-4 + * 
ж 
* * 
-6 + 
---+------------- +------------- +------------- +------------- +------------- +------------- +-- 
1.5 2.0 2.5 3:20, 3.5 4.0 4.5 
WT 


Figura 11.31: Salida de computadora de los resultados del SAS que muestra la gráfica de residuales 
del ejercicio de repaso 11.55. 
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11.13 Posibles riesgos y errores conceptuales; 
relación con el material de otros capítulos 


Cada vez que se considere utilizar la regresión lineal simple no sólo es recomendable 
elaborar una gráfica de los datos, sino esencial. Siempre es edificante elaborar una gráfica 
de los residuales ordinarios y otra de la probabilidad normal de los mismos. Además, en 
el capítulo 12 se presentará e ilustrará un tipo adicional de residual en forma estandariza- 
da. Todas esas gráficas están diseñadas para detectar la transgresión de las suposiciones. 

El uso de los estadísticos £ para las pruebas sobre los coeficientes de regresión es 
razonablemente robusto para la suposición de normalidad. La suposición de varianza 
homogénea es crucial y las gráficas de los residuales están diseñadas para detectar una 
violación. 

El material de este capítulo se utiliza ampliamente en los capítulos 12 a 15. Toda la 
información acerca del método de los mínimos cuadrados para la elaboración de mode- 
los de regresión se utilizará en el capítulo 12. La diferencia es que en ese capítulo se 
abordan las condiciones científicas en las que hay más de una sola variable x, es decir, 
más de una variable de regresión. Sin embargo, también utilizaremos el material de este 
capítulo en el que se exponen los diagnósticos de regresión, los tipos de gráficas residua- 
les, las medidas de la calidad del modelo, etcétera. El estudiante notará que en el capítu- 
lo 12 habrá más complicaciones, lo cual se debe a que los problemas de los modelos de 
regresión múltiple suelen incluir el fundamento de las cuestiones respecto a cómo las 
diversas variables de regresión entran en el modelo, e incluso el tema de cuáles variables 
deben permanecer en el modelo. De hecho, el capítulo 15 incluye el uso constante de los 
modelos de regresión, pero en el resumen al final del capítulo 12 presentaremos una 
vista preliminar de la conexión. 


Capítulo 12 


Regresión lineal múltiple y ciertos 
modelos de regresión no lineal 


12.1 Introducción 


En la mayoría de los problemas de investigación en los que se aplica el análisis de re- 
gresión se necesita más de una variable independiente para el modelo de regresión. La 
complejidad de la mayoría de mecanismos científicos es tal que, con el fin de predecir 
una respuesta importante, se requiere un modelo de regresión múltiple. Cuando un 
modelo es lineal en los coeficientes se denomina modelo de regresión lineal múltiple. 
Para el caso de k variables independientes, el modelo que da A la media de Y ks 
Х.Х. ES el modelo de regresión lineal múltiple 


My [y Xi Xk = Во + ГЕ + у + хк, 
y la respuesta estimada se obtiene a partir de la ecuación de regresión muestral 
Y = bo + bi xı +++: + рхи, 


donde cada coeficiente de regresión 8; se estima por medio de b;, a partir de los datos 
muestrales, usando el método de los mínimos cuadrados. Como ocurre en el caso de 
una sola variable independiente, a menudo el modelo de regresión lineal múltiple es una 
representación adecuada de una estructura más complicada dentro de ciertos rangos de 
las variables independientes. 

También se pueden aplicar técnicas similares de mínimos cuadrados para estimar 
los coeficientes cuando el modelo lineal incluye, por ejemplo, potencias y productos de 
las variables independientes. Un ejemplo de esto se presentaría cuando k = 1, en cuyo 
caso el experimentador podría pensar que las medias ру, по caen sobre una línea recta, 
sino que se describen de manera más adecuada mediante el modelo de regresión poli- 
nomial 


2 
Шух = Bo + Bix + Bax? +: +8B,x", 
y la respuesta estimada se obtiene de la ecuación de regresión polinomial 


ў = bo + bix + bax? +- + b,x". 
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En ocasiones se genera confusión al decir que un modelo polinomial es un mo- 
delo lineal. Sin embargo, los estadísticos normalmente se refieren a un modelo lineal 
como aquel en el que los parámetros ocurren en forma lineal, independientemente de có- 
mo las variables independientes entran en el modelo. Un ejemplo de modelo no lineal es 
la relación exponencial 


My |х = ав", 


que se estima mediante la ecuación de regresión 


Y = аі“. 


En ciencias е ingeniería hay muchos fenómenos cuya naturaleza no es inherente- 
mente lineal y, cuando se conoce su verdadera estructura, no hay duda de que habría 
que intentar ajustar el modelo real. Existe mucha literatura acerca de la estimación de 
modelos no lineales por medio de mínimos cuadrados. Los modelos no lineales que se 
analizan en este capítulo se relacionan con condiciones no ideales, en las cuales el ana- 
lista está seguro de que la respuesta y, por lo tanto, el error de respuesta del modelo no 
se distribuyen normalmente sino que, más bien, tienen una distribución binomial o de 
Poisson. Estas situaciones ocurren a menudo en la práctica. 

El estudiante que busque profundizar en la explicación de la regresión no lineal 
debe consultar la obra de Myers Classical and Modern Regression with Applications 
(1990; véase la bibliografía). 


12.2 Estimación de los coeficientes 


En esta sección se calculan los estimadores de mínimos cuadrados de los parámetros 3 
B,,..., В, mediante el ajuste del modelo de regresión lineal múltiple 


0? 


Шу |х хохь = Во + 8х1 Е + kxk 


а los puntos de los datos 
CATA Vi); і= 1, 2,...,пуп> к}, 
donde y, es Іа respuesta observada a los valores х, х,,..., х, de las k variables inde- 


pendientes Xp Хә, yo Se supone que cada observación (х, х,,..., X,» у) satisface la 
siguiente ecuación: 


Modelo de 
regresión lineal 
múltiple 


Yi = Bo + бух + ух +++ + Хы + € 
о bien, P 
Yi = Şi + ei = bo + bixi; + охо +: + рахи + ei, 
donde €, y e, son el error aleatorio y el residual, respectivamente, asociados con la res- 
puesta y, y con el valor ajustado ӯ. 


Como en el caso de la regresión lineal simple, se supone que los €, son independientes y 
están distribuidos en forma idéntica con media cero y varianza común o°. 

Si usamos el concepto de mínimos cuadrados para obtener los estimados b, b.,..., 
bo minimizamos la expresión 


n n 
2 2 
SCE =Ñ e =} (i -bo -bixi — baxo; =e — bx)”. 
і=1 і=1 
Si, a su vez, diferenciamos Іа SCE respecto a by р b, e igualamos el resultado a cero, 
generamos el conjunto de k + 1 ecuaciones normales para la regresión lineal múltiple. 
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Ecuaciones 
normales de 
estimación para 
la regresión 
lineal múltiple 


п п п п 
nbo +b X xii + bad xa + --> +0 У =) у 
= i=l i=l i=l 
n n n n n 
bo Y xiu +b X xi; + bX x1iX2i + < + b У = Y xy 
і=1 і=1 і=1 izj у=] 


п п п п п 
2 
bo › хы + bı › Xki Xii + ь У хых + + b у хр = у хи ун 
¡=1 A ¡=1 = ¡=1 


Estas ecuaciones se pueden resolver para by b, bpi b, utilizando cualquier método 
apropiado que permita resolver sistemas de ecuaciones lineales. Casi todos los progra- 
mas estadísticos de cómputo se pueden utilizar para obtener soluciones numéricas de las 
ecuaciones anteriores. 


Ejemplo 12.1: | Se sometió a prueba un grupo de camiones ligeros con motores que utilizan diesel como 


combustible para saber si la humedad, la temperatura del aire y la presión barométrica 
influyen en la cantidad de óxido nitroso que emiten (en ppm). Las emisiones se midieron 
en distintos momentos y en diversas condiciones experimentales. Los datos se presen- 
tan en la tabla 12.1. El modelo es 


Шу lx о 0 = Bo + Bixi + В2х2 + Baxa, 


o, en forma equivalente, 
у = Во + ух + B2x2; + P3x3i +é, i= 1, 2,..., 20. 


Ajuste este modelo de regresión lineal múltiple a los datos con los que cuenta y luego 
estime la cantidad de óxido nitroso que emiten los camiones en las siguientes condicio- 
nes: 50% de humedad, temperatura de 76°F y una presión barométrica de 29.30. 


Tabla 12.1: Datos para el ejemplo 12.1 


Óxido Humedad, Temp., Presión, Óxido Humedad, Temp., Presión, 
nitroso, y xi х2 X3 nitroso, y xi х2 X3 
0.90 72.4 76.3 29.18 1.07 23.2 76.8 29.38 
0.91 41.6 70.3 29.35 0.94 47.4 86.6 29.35 
0.96 34.3 77.1 29.24 1.10 31.5 76.9 29.63 
0.89 35.1 68.0 29.27 1.10 10.6 86.3 29.56 
1.00 10.7 79.0 29.78 1.10 11.2 86.0 29.48 
1.10 12.9 67.4 29.39 0.91 13:3 76.3 29.40 
1.15 8.3 66.8 29.69 0.87 75.4 77.9 29.28 
1.03 20.1 76.9 29.48 0.78 96.6 78.7 29.29 
0.77 72.2 TIA 29.09 0.82 107.4 86.8 29.03 
1.07 24.0 67.7 29.60 0.95 54.9 70.9 29.37 


Fuente: Charles Т. Hare, “Light-Duty Diesel Emission Correction Factors for Ambient Conditions”, ЕРА-600/2-77-116. 
U. S. Environmental Protection Agency. 


Solución: 


La solución del conjunto de las ecuaciones de estimación produce los estimadores únicos 


by = —-3.507778, bı = —0.002625, b, = 0.000799, b3 = 0.154155. 
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Por lo tanto, la ecuación de regresión es 


ў = —3.507778 — 0.002625x, + 0 .000799x, + 0.154155x3. 


Para 50% de humedad, una temperatura de 76°F y una presión barométrica de 29.30, la 
cantidad estimada de óxido nitroso emitido es 


$ =-3.507778 — 0.002625(50.0) + 0 .000799(76.0) + 0 .1541553(29.30) 
= 0.9384 ppm. J 


Regresión polinomial 


Ahora suponga que se desea ajustar la ecuación polinomial 
Шу = Bo + Bix + Вх? + + pra” 


alos n pares de observaciones [Gx, y); i = 1, 2,..., п}. Cada observación, у, satisface la 
ecuación 


у = fo + бух + @хў ++ б,х + е 


o bien, А А , 
yi = i; +e; = bo + bixi + box; +: + b,x; + ei, 


donde r es el grado del polinomio y €, y e, son, de nuevo, el error aleatorio y el residual 
asociados con la respuesta y, y con el valor ajustado ў, respectivamente. Aquí el número 
de pares, n, debe ser al menos r + 1, que es el número de parámetros por estimar. 

Observe que el modelo polinomial se puede considerar un caso especial del modelo 
de regresión lineal múltiple más general, donde establecemos x, = x, x, = o х= х". 
Las ecuaciones normales adoptan la misma forma que las que aparecen en la página 445. 
Luego se resuelven para р» р, р... р. 


Ejemplo 12.2: | Dados los datos 


х|0 1 2 3 4 5 6 7 8 9 
y |91 73 32 46 48 29 57 71 88 102 


ajuste una curva de regresión de la forma Hy = B, + Вх + P,x”, luego, estime Myx 
Solución: A partir de los datos se encuentra que 


10bo+ 45b + 285 р = 63.7, 
45bọo + 285 + 2025b, = 307.3, 
285b + 2025 b, + 15,333b, = 2153.3. 


Al resolver las ecuaciones normales se obtiene 
bo = 8.698, bi = —2.341, b= 0.288. 
Por lo tanto, 


ў = 8.698 — 2.341x + 0.288х2 
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Cuando x = 2 el estimado de My €S 


ў = 8.698 — (2.341)(2) + (0.288)(22) = 5.168. J 


Ejemplo 12.3: | Los datos de la tabla 12.2 representan el porcentaje de impurezas que resultaron de di- 
versas temperaturas y del tiempo de esterilización durante una reacción asociada con la 
fabricación de cierta bebida. Estime los coeficientes de regresión en el modelo polino- 
mial 


yi = Bo + хи + х2: + Bux; + 32х5; + бох Хә + €i, 


para і = 1, 2,...,18. 
Tabla 12.2: Datos para el ejemplo 12.3 


Tiempo de Temperatura, x; (°С) 
esterilización, x2 (min) 75 100 125 

15 14.05 10.55 7.55 

14.93 9.48 6.59 

20 16.56 13.63 9.23 

15.85 11.75 8.78 

25 22.41 18.55 15.93 


21.66 17.98 16.44 
Solución: Si usamos las ecuaciones normales, obtenemos 
ро = 56.4411, bı = —0.36190, ро = —2.75299, 
Р = 0.00081, ba = 0.08173, bi = 0.00314, 


y nuestra ecuación de regresión estimada es 
$ = 56.4411 —0.36190x, — 2.75299х» + 0.00081x7 + 0.08173x3 + 0.00314x 1x2. J 


Muchos de los principios y procedimientos asociados con la estimación de funcio- 
nes de regresión polinomiales caen en la categoría de metodología de respuesta super- 
ficial, que es un conjunto de técnicas que los científicos e ingenieros de muchos campos 
han utilizado con bastante éxito. Las х se denominan términos cuadráticos puros y las 
xx (i # j) se conocen como términos de interacción. Dichas técnicas a menudo se apli- 
can a problemas tales como seleccionar un diseño experimental adecuado, en particular 
en casos en los que un número muy grande de variables entra en el modelo; y elegir con- 
diciones óptimas de operación para х, х,,..., X Para profundizar en este tema se reco- 
mienda al lector consultar la obra de Myers, Montgomery y Anderson-Cook, Response 
Surface Methodology: Process and Product Optimization Using Designed Experiments 
(2009; véase la bibliografía). 


12.3 Modelo de regresión lineal en el que se utilizan matrices 


Al ajustar un modelo de regresión lineal múltiple, en particular cuando contiene más 
de dos variables, tener conocimientos sobre la teoría de matrices facilita considerable- 
mente el manejo de las matemáticas. Suponga que el experimentador tiene k variables 
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independientes x, X,,..., х, y n Observaciones у, y,»..., y, , cada una de las cuales se puede 
expresar con la ecuación 


у = Po + Вх: + дохо; ++ + Вехи + є. 


Este modelo representa en esencia а n ecuaciones que describen cómo se generan los 
valores de la respuesta durante el proceso científico. Si usamos la notación de matrices, 
podemos escribir la ecuación siguiente 


Modelo lineal у= ХВ + є, 
general donde 


yı І xu xa сс Х| Bo €l 

y2 1 xp хә хо Br є2 
у= |.|, Xs]; , 4 „| B=l |, є= 

Yn 1 Xin X2n +++ Xkn Pr En 


Después, el método de mínimos cuadrados para la estimación de 6, que se estudió 
en la sección 12.2, implica calcular b, para lo cual 


SCE = (y —Xb)(y —Xb) 
se minimiza. Este proceso de minimización implica resolver para b en la ecuación 


д 
—(SCE) = 0. 
ЕТА ($СЕ) = 0 


Aquí no presentaremos los detalles respecto a cómo se resuelven las ecuaciones anterio- 
res. El resultado se reduce a la solución de b en 
(X'X)b = Хуу. 


Observe la naturaleza de la matriz X. Además del elemento inicial, el i-ésimo renglón 
representa los valores de x que dan lugar a la respuesta у. Si escribimos 


n 
А Ух; УЖ ЭЕ mes NX ix dá 
А = ХХ = | i= і= і=1 i= 


n n 
De У\ ruži У\ Xi Xni Sez уа 


= i=l i=l i=1 


gk = У) Xxidi 


nos permite escribir las ecuaciones normales en la forma de matriz 
Ab =g. 
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Si la matriz A es no singular, la solución para los coeficientes de regresión se escribe 
como 


b=A7lg=(X'X) Xy. 


De esta manera, obtenemos la ecuación de predicción o regresión resolviendo un con- 
junto de k + 1 ecuaciones con un número igual de incógnitas. Esto implica el invertir 
la matriz Х”Х de orden k + 1 por k + 1. En la mayoría de libros que tratan sobre de- 
terminantes y matrices elementales se explican las técnicas para invertir matrices. Por 
supuesto, existen muchos paquetes de cómputo veloces para resolver problemas de re- 
gresión múltiple, los cuales no sólo proporcionan estimados de los coeficientes de regre- 
sión, sino que también ofrecen otra clase de información relevante para hacer inferencias 
acerca de la ecuación de regresión. 


Ejemplo 12.4: | Se midió el porcentaje de supervivencia de los espermatozoides de cierto tipo de semen 
animal, después de almacenarlo con distintas combinaciones de concentraciones de tres 
materiales que se emplean para incrementar la supervivencia. En la tabla 12.3 se presen- 
tan los datos. Obtenga el modelo de regresión lineal múltiple para los datos. 


Tabla 12.3: Datos para el ejemplo 12.4 


y (% de supervivencia) xı (peso %) хэ (peso %) хз (реѕо %) 

25.5 1.74 5.30 10.80 

31.2 6.32 5.42 9.40 

25.9 6.22 8.41 7.20 

38.4 10.52 4.63 8.50 

18.4 1.19 11.60 9.40 

26.7 1.22 5.85 9.90 

26.4 4.10 6.62 8.00 

25.9 6.32 8.72 9.10 

32.0 4.08 4.42 8.70 

25.2 4.15 7.60 9.20 

39.7 10.15 4.83 9.40 

35.7 1.72 3.12 7.60 

26.5 1.70 5.30 8.20 
Solución: Las ecuaciones de estimación por mínimos cuadrados, (X”X)b = X'y, son 

13.0 59.43 81.82 115.40 bo 377.5 

59.43 394.7255 360.6621 522.0780 bi| | 1877.567 
81.82 360.6621 576.7264 728.3100 b2| | 2246.661 
115.40 522.0780 728.3100 1035.9600 b3 3337.780 


A partir de una salida de computadora se obtienen los elementos de la matriz inversa 


8.0648 —0.0826 —0.0942 —0.7905 
—0.0826 0.0085 0.0017 0.0037 
—0.0942 0.0017 0.0166 —0.0021|” 
—0.7905 0.0037 —0.0021 0.0886 


(ХХ)! = 


y, luego, utilizando la relación b = (Х”Х)-!Х'у, se obtienen los siguientes coeficientes 
de regresión estimados 
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by = 39.1574, Ь = 1.0161, b2 = —1.8616, b3 = —0.3433. 


Entonces, la ecuación de regresión estimada es 
Y = 39.1574 + 1.0161х — 1.8616х› — 0.3433x3. 3 


Ejercicios 

12.1 Se llevó a cabo un conjunto de ensayos experi- 
mentales con un horno para determinar una forma de 
predecir el tiempo de cocción, y, a diferentes niveles 
de ancho del horno, x ya diferentes temperaturas, xX, 
Se registraron los siguientes datos: 


y Xi X2 
6.40 1.32 1.15 
15.05 2.69 3.40 
18.75 3.56 4.10 
30.25 4.41 8.75 
44.85 5.35 14.82 
48.94 6.20 15.15 
51.55 7.12 15.32 
61.50 8.87 18.18 
100.44 9.80 35.19 
111.42 10.65 40.40 


Estime la ecuación de regresión lineal múltiple 
Шу [хіх ~ Во + Вх. + B2x2. 


12.2 En Applied Spectroscopy se estudiaron las pro- 
piedades de reflectancia infrarroja de un líquido vis- 
coso que se utiliza como lubricante en la industria 
electrónica. El experimento que se diseñó consistió en 
medir el efecto de frecuencia de banda, x, y el espesor 
de película, x, sobre la densidad óptica, y, usando un 
espectrómetro infrarrojo Perkin-Elmer Modelo 621. 
(Fuente: Pacansky, J., England, C. D. y Wattman, R., 
1986). 


y Xi X2 
0.231 740 1.10 
0.107 740 0.62 
0.053 740 0.31 
0.129 805 1.10 
0.069 805 0.62 
0.030 805 0.31 
1.005 980 1.10 
0.559 980 0.62 
0.321 980 0.31 
2.948 1235 1.10 
1.633 1235 0.62 
0.934 1235 0.31 


Estime la ecuación de regresión lineal múltiple 
Y = bo + рх + Рох. 


12.3 En el ejercicio de repaso 11.53 de la página 437 
suponga que también se proporciona el número de pe- 
riodos de clase perdidos por los 12 estudiantes que to- 
man el curso de química. A continuación se presentan 
los datos completos. 


Calificación Calificación en Clases 


Estudiante en química, y el examen, х: perdidas, х2 


1 85 65 1 
2 74 50 7 
3 76 55 5 
4 90 65 2 
5 85 55 6 
6 87 70 3 
7 94 65 2 
8 98 70 5 
9 81 55 4 
10 91 70 3 
11 76 50 1 
12 74 55 4 


a) Ajuste una ecuación de regresión lineal múltiple 
de la forma ӯ, = b, + bx, + b,x, 

b) Estime la calificación de química para un estu- 
diante que en la prueba de inteligencia obtuvo 60 
de calificación y perdió 4 clases. 


12.4 Se realizó un experimento para determinar si era 
posible predecir el peso de un animal después de un 
periodo determinado con base en su peso inicial y la 
cantidad de alimento que consumía. Se registraron los 
siguientes datos, en kilogramos: 


Peso Peso Peso del 
final, y inicial, x, alimento, x2 
95 42 272 
77 33 226 
80 33 259 
100 45 292 
97 39 311 
70 36 183 
50 32 173 
80 41 236 
92 40 230 
84 38 235 
a) Ajuste una ecuación de regresión múltiple de la 
forma 


HY |ху,х; = Во + 8х1 + Вх». 

b) Prediga cuánto pesará un animal que comienza 
pesando 35 kilogramos después de consumir 250 
kilogramos de alimento. 

12.5 Se cree que la energía eléctrica que una planta 
química consume cada mes se relaciona con la tempe- 
ratura ambiental promedio, x,, el número de días del 
mes, х,, la pureza promedio del producto, х, y las tone- 
ladas fabricadas del producto, x,. Se dispone de datos 
históricos del año anterior, los cuales se presentan en la 
siguiente tabla. 


Ejercicios 


290 45 24 88 110 
274 60 25 87 88 
301 65 25 91 94 
316 72 26 94 99 
300 80 25 87 97 


267 75 24 88 110 
276 60 25 91 105 
288 50 25 90 100 


261 38 23 89 98 

a) Ajuste un modelo de regresión lineal múltiple 
usando el conjunto de datos anterior. 

b) Prediga el consumo de energía para un mes en que 
x, = 75°F, x, = 24 días, x, = 90% y x, = 98 tone- 
ladas. 

12.6 Se realizó un experimento sobre un modelo 
nuevo de una marca de automóvil específica para de- 
terminar la distancia de frenado a distintas velocidades. 
Se registraron los siguientes datos. 


Velocidad, v (km/h) | 35 50 65 8095 110 


Distancia de frenado, d (т) 16 26 41 62 88 119 
a) Ajuste una curva de regresión múltiple de la forma 


Ho» = Во + бу + зу”. 
b) Estime la distancia de frenado cuando el automó- 
vil viaja a 70 kilómetros por hora. 


12.7 Se realizó un experimento con el fin de determi- 
nar si el flujo sanguíneo cerebral de los seres humanos 
se podía predecir a partir de la tensión arterial del oxí- 
geno (milímetros de mercurio). En el estudio partici- 
paron 15 pacientes y se reunieron los siguientes datos: 


Flujo Tensión arterial 
sanguíneo, y del oxígeno, x 
84.33 603.40 
87.80 582.50 
82.20 556.20 
78.21 594.60 
78.44 558.90 
80.01 575.20 
83.53 580.10 
79.46 451.20 
75.22 404.00 
76.58 484.00 
77.90 452.40 
78.80 448.40 
80.67 334.80 
86.60 320.30 
78.20 350.30 


Estime la ecuación de regresión cuadrática 


иур = бо + Bix + Bar. 
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12.8 El siguiente es un conjunto de datos experimen- 
tales codificados acerca de la resistencia a la compre- 
sión de una aleación específica para distintos valores de 
la concentración de cierto aditivo: 


Concentración, Resistencia a 
x la compresión, y 
10.0 25.2 27.3 28.7 
15.0 29.8 31.1 27.8 
20.0 31.2 32.6 29.7 
25.0 31.7 30.1 32.3 
30.0 29.4 30.8 32.8 
a) Estime la ecuación de regresión cuadrática и, „= 
B, + Bx + б. 


b) Pruebe la falta de ajuste del modelo. 
12.9 a) Ajuste una ecuación de regresión múltiple de 
la forma шу = В, + Вх, + В? para los datos del 
ejemplo 11.8 de la página 420. 
b) Estime el producto de la reacción química para 
una temperatura de 225°С. 
12.10 Рага los datos siguientes 
х|0 1 2 3 
у|1 4 5 3 
a) Ajuste el modelo cúbico 


Hy ү = Bo+Bix + эх” +Bax?. 
b) Prediga el valor de Y cuando x = 2. 


12.11 Se realizó un experimento para estudiar el 
tamaño de los calamares consumidos por tiburones y 
atunes. Las variables regresoras son características de 
la boca del calamar. Los datos del estudio son los si- 
guientes: 


ХІ X2 X3 X4 X5 y 
1.31 1.07 0.44 0.75 0.35 1.95 
155 1.49 0.53 0.90 0.47 2.90 
0.99 0.84 0.34 0.57 0.32 0.72 
0.99 0.83 0.34 0.54 0.27 0.81 
1.01 0.90 0.36 0.64 0.30 1.09 
1.09 0.93 0.42 0.61 0.31 1.22 
1.08 090 0.40 0.51 0.31 1.02 
1.27 1.08 0.44 0.77 0.34 1.93 
0.99 0.85 0.36 0.56 0.29 0.64 
1.34 1.13 0.45 0.77 0.37 2.08 
130 1.10 0.45 0.76 0.38 1.98 
133 1.10 0.48 0.77 0.38 1.90 
1.86 1.47 0.60 1.01 0.65 8.56 
1.58 1.34 0.52 0.95 0.50 4.49 
1.97 1.59 0.67 1.20 0.59 8.49 
1.80 1.56 0.66 1.02 0.59 6.17 
1.75 1.58 0.63 1.09 0.59 7.54 
172 1.43 0.64 1.02 0.63 6.36 
1.68 1.57 0.72 0.96 0.68 7.63 
1.75 1.59 0.68 1.08 0.62 7.78 
2.19 1.86 0.75 1.24 0.72 10.15 
1.73 1.67 0.64 1.14 0.55 6.88 
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En el estudio las variables regresoras y la respuesta 
considerada son 


x, = longitud del rostral, en pulgadas, 

x, = longitud de la aleta, en pulgadas, 

x, = longitud del rostral a la cola, en pulgadas, 
x, = longitud de la cola a la aleta, en pulgadas, 
x, = ancho, en pulgadas, 


y = peso, en libras. 


Estime la ecuación de regresión lineal múltiple 


Hy |х1, х2, х3, х4, X5 


= Bo + {х1 + 5х2 + B3x3 + Paxa + 5х5. 


12.12 Los siguientes datos reflejan información ob- 
tenida en 17 hospitales de la marina estadounidense 
ubicados en diversos sitios del mundo. Los regresores 
son variables de la carga de trabajo, es decir, conceptos 
que dan como resultado la necesidad de personal en 
un hospital. A continuación se presenta una descripción 
breve de las variables: 


y = horas de trabajo mensuales, 

x, = carga diaria promedio de pacientes, 
x, = exposiciones de rayos X mensuales, 
x, = días-cama ocupados por mes, 

x, = población elegible en el área/1000, 


x. = duración promedio de la estancia de un pa- 
ciente, en días. 


4 


Sitio xı х2 Хз X4 х5 у 
1 15.57 2463 472.92 18.0 4.45 566.52 
2 44.02 2048 1339.75 9.5 6.92 696.82 
3 20.42 3940 620.25 12.8 4.28 1033.15 
4 18.74 6505 568.33 367 3.90 1003.62 
5 4920 5723 1497.60 35.7 5.50 1611.37 
6 44.92 11,520 1365.83 240 4.60 1613.27 
7 55.48 5779 1687.00 43.3 5.62 1854.17 
8 59.28 5969 1639.92 467 5.15 2160.55 
9 94.39 8461 2872.33 787 6.18 2305.58 
10 128.02 20,106 3655.08 1805 6.15 3503.93 
11 96.00 13,313 2912.00 609 5.88 3571.59 
12 131.42 10,771 3921.00 1037 4.88 3741.40 
13 127.21 15,543 3865.67 126.8 5.50 4026.52 
14 252.90 36,194 7684.10 157.7 7.00 10,343.81 
15 409.20 34,703 12,446.33 169.4 10.75 11,732.17 
16 463.70 39,204 14,098.40 331.4 7.05 15,414.94 
17 510.22 86,533 15,524.00 371.6 6.35 18,854.45 


El objetivo es generar una ecuación empírica рага es- 
timar (o predecir) las necesidades de personal en los 
hospitales de la marina. Calcule la ecuación de regre- 
sión lineal múltiple 


Hy [х 1,х2,х3,х4,х5 


= Bo + {1х1 + х2 + 3х3 + ха + 85х5. 


12.13 Se llevó a cabo un estudio sobre un tipo de 
conexión para conocer la relación entre la cantidad 
de desgaste, y, para x, = viscosidad del aceite, y x, = 
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carga. Se obtuvieron los datos siguientes. (Tomado de 
Response Surface Methodology, Myers, Montgomery y 
Anderson-Cook, 2009). 


y xı X2 | у х х2 

193 1.6 851 230 15:5 816 
172 22.0 1058 91 43.0 1201 
113 33.0 1357 125 40.0 1115 


а) Estime los parámetros desconocidos de la ecua- 
ción de regresión lineal múltiple 


HY |х\,хә =Bo0+Bix1 + Вх. 


b) Prediga el desgaste cuando la viscosidad del aceite 
sea de 20 y la carga sea de 1200. 


12.14 Once estudiantes normalistas participaron en 
un programa de evaluación diseñado para medir la efi- 
cacia de los maestros y determinar cuáles factores son 
importantes. La medición de la respuesta consistió en 
una evaluación cuantitativa del maestro. Las variables 
regresoras fueron las calificaciones de cuatro pruebas 
estandarizadas aplicadas a cada maestro. Los datos son 
los siguientes: 


y Xi X2 X3 X4 
410 69 125 59.00 55.66 
569 57 131 31.75 63.97 
425 77 141 80.50 45.32 
344 81 122 75.00 46.67 
324 0 141 49.00 41.21 
505 53 152 49.35 43.83 
235 77 141 60.75 41.61 
501 76 132 41.25 64.57 
400 65 157 50.75 42.41 
584 97 166 32:25 57.95 
434 76 141 54.50 57.90 


Estime Ја ecuación de regresión lineal múltiple 
HY lxi.x2.x3.x4 = Bo + Вх +B2x2 + Bx3 + Ваха. 


12.15 Con el fin de determinar la relación entre la ca- 
lificación de su desempeño laboral (y) y las calificacio- 
nes en cuatro exámenes, el departamento de personal 
de cierta empresa industrial realizó un estudio en el que 
participaron 12 sujetos. Los datos son los siguientes: 


y Xi Xx Хз X4 

11.2 56.5 71.0 38.5 43.0 
145 595 72.5 38.2 44.8 
17.2 69.2 76.0 42.5 49.0 
178 745 79.5 43.4 56.3 
19.3 81.2 84.0 47.5 60.2 
245 88.0 86.2 474 62.0 
21.2 78.2 80.5 44.5 581 
16.9 69.0 72.0 41.8 48.1 
14.8 58.1 68.0 42.1 46.0 
20.0 80.5 85.0 48.1 60.3 
13.2 58.3 71.0 37.5 47.1 
22.5 84.0 87.2 51.0 65.2 
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Estime los coeficientes de regresión del modelo 


X1, X2, X3, y, 
$ =bo+bix1 + ох + b3x3 + ых. RS del emisor RS de la base E-B-RS hFE 
16.12 220.5 37 48.14 
12.16 Un ingeniero de una empresa de semiconduc- 15.13 223.5 a o 
tores desea modelar la relación entre la ganancia o hFE 15.50 217.6 5.000 82.68 
de un dispositivo (y) y tres parámetros: RS del emisor 15.13 228.5 6.625 112.60 
(x), RS de la base (x,) y RS del emisor a la base (x,). A 15.50 230.2 5.750 97.52 
continuación se muestran los datos: 16.12 226.5 3.750 59.06 
xa х рр 1563 2256 5375 8909 
RS del emisor RS де la base E-B-RS hFE 15.38 2340 8.875 171.90 
14.62 226.0 7.000 128.40 15.50 230.0 4.000 66.80 
15.63 220.0 3.375 52.62 14.25 224,3 8.000 157.10 
14.62 217.4 6.375 113.90 14.50 240.5 10.870 208.40 
15.00 220.0 6.000 98.01 14.62 223.7 7.375 133.40 
Г. = a a ко. (Datos de Myers, Montgomery y Anderson-Cook, 2009). 
` ` ` (с ont.) a) Ajuste una regresión lineal múltiple para los datos. 


b) Prediga hFE cuando х, = 14, x, = 220 y x, = 5. 


12.4 Propiedades de los estimadores de mínimos cuadrados 


Las medias y varianzas de los estimadores by bps b, se obtienen con facilidad si se 
hacen ciertas suposiciones sobre los errores aleatorios €» E Є, que son idénticas 
a las que se hacen en el caso de la regresión lineal simple. Si suponemos que dichos 
errores son independientes, cada uno con media igual a cero y varianza o°, entonces 
podemos demostrar que by bigis b, son, respectivamente, estimadores no sesgados de 
los coeficientes de regresión В,, Ва В,. Además, las varianzas de las р se obtienen рог 
medio de los elementos del inverso de la matriz A. Observe que los elementos fuera de la 
diagonal de A = Х”Х representan sumas de productos de los elementos en las columnas 
de X; mientras que los elementos en la diagonal de A son las sumas de los cuadrados de 
los elementos en las columnas de X. La matriz inversa, А-!, aparte del multiplicador a, 
representa la matriz de varianza-covarianza de los coeficientes de regresión estima- 
dos. Es decir, los elementos de la matriz A7!0? muestran las varianzas de bb peb, en 
la diagonal principal y las covarianzas fuera de la diagonal. Por ejemplo, en un problema 
de regresión lineal múltiple con k = 2 se podría escribir 


Coo Cor со? 
XX)! = [cio си сш 
Со Ср C2 
con los elementos debajo de la diagonal principal determinados por la simetría de la 
matriz. Entonces, se escribe 
оу = i0’, i=0,1,2, 
як o r 
Ob; b = Covíb;, bj) = CjO, 1 £j. 
Desde luego, los estimados de las varianzas y, por lo tanto, sus errores estándar, se 


obtienen reemplazando т? con el estimado apropiado, el cual se obtuvo a partir de los 
datos experimentales. Un estimado no sesgado de т? de nuevo se define en términos de 
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Teorema 12.1: 
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la suma de cuadrados del error, que se calcula utilizando la fórmula establecida en el teo- 
rema 12.1. En el teorema las suposiciones se basan en los €, descritos con anterioridad. 


Para la ecuación de regresión lineal 
AA 
un estimador insesgado de т? es dado por el error o media cuadrática residual 


SCE n n 
52 = === donde SCE = >а = 0 A 
i=1 i=l 

Podemos ver que, para el caso de la regresión lineal simple, el teorema 12.1 re- 
presenta una generalización del teorema 11.1. La prueba se deja como ejercicio para 
el lector. Al igual que en el caso de la regresión lineal más simple, el estimado de s? es 
una medida de la variación de los errores de la predicción o residuales. En las secciones 
12.10 y 12.11 se presentan otras inferencias importantes relacionadas con la ecuación 
ajustada de regresión, con base en los valores de los residuales individuales е, = y, — ĵ, 
LSN 2.2 

La suma de cuadrados del error y de la regresión adoptan la misma forma y desem- 
peñan el mismo papel que en el caso de la regresión lineal simple. De hecho, la identidad 
de la suma de cuadrados 


Уо 3 = YO, -9 + У Оо 9)? 


і=1 і=1 і=1 
se sigue cumpliendo, y se conserva la notación anterior, que es, 


STCC =SCR + SCE, 


con 
n 


STCC = Уо — y)? = suma de cuadrados total 


i=1 


п 


SCR = NO — yy = suma de cuadrados de regresión 


і=1 


Нау k grados de libertad asociados con la SCR, у, como siempre, la STCC tiene 
п — 1 grados de libertad. Por lo tanto, después de restar, la SCE tiene п — k — 1 grados 
de libertad. Así, nuestro estimado de т? de nuevo es dado por la suma de cuadrados del 
error dividida entre sus grados de libertad. Las tres sumas de cuadrados aparecen en la 
salida de resultados de la mayoría de los programas de cómputo de regresión múltiple. 
Observe que la condición n > k en la sección 12.2 garantiza que los grados de libertad 
de la SCE no sean negativos. 
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Análisis de varianza en la regresión múltiple 


La partición de la suma total de cuadrados en sus componentes, la suma de cuadrados de 
regresión y del error desempeña un papel importante. Puede efectuarse un análisis 
de varianza que arroje luz sobre la calidad de la ecuación de regresión. Una hipótesis 
que sirve para determinar si el modelo explica una cantidad significativa de variación, 
es la siguiente: 


Ho: В =b = В =з = В = 0. 
El análisis de varianza implica una prueba F, mediante una tabla, como la siguiente: 
Fuente Suma de cuadrados Grados de libertad Cuadrados medios F 
Regresión SCR k CMR = 6—4 у= 59 
Error SCE п— (К+ 1) СМЕ = =D 
Total STCC n=1 


Se trata de una prueba de cola superior. El rechazo de Н, significa que la ecuación de 
regresión difiere de una constante. Es decir, al menos una variable regresora es impor- 
tante. En las secciones que siguen se estudia más el uso del análisis de varianza. 

Otra utilidad del cuadrado medio del error (o cuadrado medio residual) estriba en su 
uso para la prueba de hipótesis y la estimación de intervalos de confianza que se estudian 
en la sección 12.5. Además, el cuadrado medio del error desempeña un papel importante en 
las situaciones en las que el científico busca el mejor modelo entre un conjunto de ellos que 
están en competencia. Muchos criterios de construcción de modelos incluyen el estadístico 
52, En la sección 12.11 se presentan criterios para comparar modelos en competencia. 
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El conocimiento de la distribución de los estimadores del coeficiente individual facilita 
al experimentador construir intervalos de confianza para los coeficientes y hacer pruebas 
de hipótesis acerca de ellos. Recuerde que en la sección 12.4 estudiamos que b, (j = 0, 
1, 2,..., k) se distribuyen de forma normal con media В, y varianza ca. De esta manera, 
se puede utilizar el estadístico 
‚_ Bio 
Sa/Cjj 

соп п — k — 1 grados de libertad para probar hipótesis y construir intervalos de confianza 
sobre PB, Por ejemplo, si queremos probar 


Ho: 8; = jo, 
Hı: B; + Bjo 


se calcula el estadístico f anterior y no se rechaza Н, si —1,,, < £ < t,,, donde т „ tiene 
n — k — 1 grados de libertad. 
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Ejemplo 12.5: | Para el modelo del ejemplo 12.4 pruebe la hipótesis de que 8, = —2.5 en comparación 
con la alternativa de que 8, > —2.5 a un nivel de significancia de 0.05. 

Solución: 
Ho: Ө» a —2.5, 
Н}: Ө» > —2.5. 
Cálculos: 
bı = —1.8616 + 2.5 
= bə — Во A = 2.390, 
5 \/С22 2.073%0.0166 
Р = P(T > 2.390) = 0.04. 
Decisión: Rechazar H, у concluir que 8, > —2.5. И | 


Pruebas ź individuales para la selección de variables 


La prueba 1 que se utiliza con más frecuencia en la regresión múltiple es aquella que 
prueba la importancia de los coeficientes individuales, es decir, Н: В, = 0 en сотрага- 
ción con la hipótesis alternativa HA: 8, F 0. Con frecuencia estas pruebas contribuyen 
a lo que se denomina selección de variables, con la cual el analista intenta llegar al 
modelo más útil, es decir, a la elección de cuál regresor utilizar. Aquí debemos destacar 
que, si se encuentra que un coeficiente es insignificante, es decir, si no se rechaza la 
hipótesis Н: В, = 0, la conclusión que se obtiene es que la variable es insignificante 
(explica una cantidad insignificante de la variación de y) en la presencia de los demás 
regresores del modelo. Más adelante se profundizará en este punto. 


Inferencias sobre la respuesta media y la predicción 


Una de las inferencias más útiles que se pueden hacer con respecto a la calidad de la 
respuesta predicha y,, correspondiente a los valores X p X,» Xy es el intervalo de 
confianza sobre la respuesta media иу] х,,, Xyy»-.-»X,y- Estamos interesados en construir un 
intervalo de confianza sobre la respuesta media para el conjunto de condiciones deter- 


minadas por 


хо = [1,х10,Х20›,...,Хк0]. 


Se aumentan en 1 las condiciones sobre las x para facilitar la notación de matrices. La 
normalidad en los €, producen normalidad en los b, y la media y la varianza siguen 
siendo las mismas, como se indica en la sección 12.4. Así es la covarianza entre b, y b, 
рага i + j. De esta manera, 


también se distribuye normalmente y es, de hecho, un estimador no sesgado para la 
respuesta media sobre la que se intenta ligar un intervalo de confianza. La varianza de 
ӯ, escrita con notación de matriz simplemente como función de т?, (Х'Х)-!, y el vector 
de condiciones, х es 


2 2 =j 
с, = с хо(Х'Х) хо. 
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Si esta expresión se extendiera para un caso dado, por ejemplo k = 2, ya vimos que ex- 
plica de manera apropiada la varianza de b, y la covarianza de b, y b, para i + j. Después 
de sustituir o° con s?, según se plantea еп el teorema 12.1, el intervalo de confianza del 
100(1 — 0)% se puede construir sobre Myy = ХХ go ==> а partir del estadístico 

fo — Hy |X10> X20»=> Хко 


Sy Xx (XX) Xo ' 


que tiene una distribución t con n — k — 1 grados de libertad. 


Т = 


Intervalo de 
confianza para 
Hy |X 10, X20 ,--., Xk 0 


Un intervalo de confianza de 100(1 — а)% para la respuesta media Hy |, „х... х,о 


Yo = Їау28 V Xx (XX) Xo < Hy |x 10, хоо a+ ků < Yo + laJ25 V xo (X XX) 7x0, 


donde г, es un valor de la distribución 1 con п — k — 1 grados de libertad. 


Es frecuente que a la cantidad s/x¿(X"X)7!xg se le denomine error estándar 
de la predicción y aparece en la salida de resultados de muchos paquetes de cómputo 
para regresión. 


Ejemplo 12.6: | Con los datos del ejemplo 12.4 construya un intervalo de confianza de 95% para la res- 


Solución: 


puesta media, cuando x, = 3%, x, = 8% y x, = 9%. 
De la ecuación de regresión del ejemplo 12.4, el porcentaje estimado de supervivencia 
cuando ху = 3%, x2 = 8%, y хз = 9% , es: 

Y = 39.1574 + (1.0161)(3) — (1.8616)(8) — (0.3433)(9) = 24.2232. 


Y luego se determina que 

8.0648 —0.0826 —0.0942 —0.7905 
—0.0826 0.0085 0.0017 0.0037 
—0.0942 0.0017 0.0166 —0.0021 
—0.7905 0.0037 —0.0021 0.0886 


Xx (XX )7 xp = [1,3,8,9] 


NN 0 UY н 


= 0.1267. 


Si utilizamos el cuadrado medio del error, s? = 4.298 o s = 2.073, y la tabla A.4, obser- 
vamos que f p5 = 2.262 para 9 grados de libertad. Por lo tanto, un intervalo de confianza 
de 95% para el porcentaje medio de supervivencia para x, = 3%, x, = 8% y x, = 9% es 


dado por 
24.2232 — (2.262)(2.073)V 0.1267 < Hy 13,89 
< 24.2232 + (2.262)(2.073)\/0.1267, 


o simplemente 22.5541 < Hy j3,8,9 < 25.8923. | 

Como ocurre en el caso de la regresión lineal simple, necesitamos distinguir соп 
claridad entre el intervalo de confianza sobre la respuesta media y el intervalo de predic- 
ción sobre una respuesta observada. Esta última proporciona un límite dentro del cual 
podemos decir que, con un grado preseleccionado de certidumbre, caerá una respuesta 
nueva observada. 

Nuevamente se establece un intervalo de predicción para una sola respuesta pre- 
dicha y, al considerar la diferencia ў, — y, Se puede demostrar que la distribución del 


muestreo es normal con media 
ӯ -уо = 0 
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Intervalo de 
predicción para y, 
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y varianza 


ог 


Ўо —=У0 


= о?[1+х(Х/Х)-!хє]. 
Por consiguiente, se puede construir un intervalo de predicción del 100(1 — @)% para un 
solo valor de predicción y, a partir del estadístico 
_ Yo — Уо 
ЗС) xo 


el cual tiene una distribución £ con п — k — 1 grados de libertad. 


Un intervalo de predicción del 100(1 — @)% para una sola respuesta y, es dado por 


Yo = ЕА + х/(Х'Х)-!хо < yo < ĵo +11 +х(Х/Х)-!хб, 


donde г, es un valor de la distribución £ con n — k — 1 grados de libertad. 


Ejemplo 12.7: | Con los datos del ejemplo 12.4 construya un intervalo de predicción de 95% para una res- 


Solución: 


puesta individual del porcentaje de supervivencia, cuando х = 3%, x2 = 8%, y хз = 9%. 
Si nos remitimos a los resultados del ejemplo 12.6, encontramos que el intervalo de 
predicción de 95% para la respuesta y,, cuando xı = 3%, x2 = 8%, у хз = 9%, es 


24.2232 —(2.262)(2.073) y 1.1267 < yy < 24.2232 + (2.262)(2.073) y 1.1267, 


que se reduce a 19.2459 < y, < 29.2005. Observe que, como se esperaba, el intervalo 
de predicción es considerablemente más ancho que el intervalo de confianza para el 
porcentaje medio de supervivencia del ejemplo 12.6. 


Salida de resultados comentado para los datos del ejemplo 12.4 


La figura 12.1 muestra una salida de resultados por computadora con comentarios para 
el ajuste de regresión lineal múltiple de los datos del ejemplo 12.4. Se empleó el paquete 
SAS. 

Observe los estimados de los parámetros del modelo, los errores estándar y los 
estadísticos г que aparecen en el listado. Los errores estándar se calcularon a partir de 
las raíces cuadradas de los elementos de la diagonal (X”X)”'s?. En dicha ilustración la 
variable x, es insignificante en presencia de x, y х, con base en la prueba ѓу el valor Р 
correspondiente de 0.5916. Los términos CLM y CLI son intervalos de confianza sobre 
la respuesta media y los límites de predicción sobre una observación individual, respec- 
tivamente. La prueba fen el análisis de varianza indica que se explica una cantidad signi- 
ficativa de variabilidad. Como ejemplo de las interpretaciones de CLM y CLI, considere 
la observación 10. Con una observación de 25.2000 y un valor predicho de 26.0676 
tenemos 95% de confianza en que la respuesta media está entre 24.5024 y 27.6329, y en 
que una observación nueva caerá entre 21.1238 y 31.0114 con una probabilidad de 0.95. 
El valor R? de 0.9117 implica que el modelo explica el 91.17% de la variabilidad de la 
respuesta. En la sección 12.6 se analiza más a fondo R’. 
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Source 
Model 
Error 


Corrected Total 


Root MSE 


Dependent Mean 


Coeff Var 


Variable 
Intercept 
х1 

х2 

х3 


Dependent Predicted 


Variable 
25.5000 
31.2000 
25.9000 
38.4000 
18.4000 
26.7000 
26.4000 
25.9000 
32.0000 
25.2000 
39.7000 
35.7000 
26.5000 


Obs 


bere 
о М ҥе © ї\о со Jou о Мм ҥе 


DF 


к кш ҥш ы 


Sum of Mean 
DF Squares Square F Value Pr > Е 
3 399.45437 133.15146 30.98 <.0001 
9 38.67640 4.29738 
12 438.13077 
2.07301 R-Square 0.9117 
29.03846 Adj R-Sq 0.8823 
7.13885 
Parameter Standard 
Estimate Error t Value Pr > |t] 
39.15735 5.88706 6.65 <.0001 
1.01610 0.19090 5.32 0.0005 
-1.86165 0.26733 -6.96 <.0001 
-0.34326 0.61705 -0.56 0.5916 
Std Error 
Value Mean Predict 95% CL Mean 95% CL Predict Residual 
27.3514 1.4152 24.1500 30.5528 21.6734 33.0294 -1.8514 
32.2623 0.7846 30.4875 34.0371 27.2482 37.2764 -1.0623 
27.3495 1.3588 24.2757 30.4234 21.7425 32.9566 -1.4495 
38.3096 1.2818 35.4099 41.2093 32.7960 43.8232 0.0904 
15.5447 1.5789 11.9730 19.1165 9.6499 21.4395 2.8553 
26.1081 1.0358 23.7649 28.4512 20.8658 31.3503 0.5919 
28.2532 0.8094 26.4222 30.0841 23.2189 33.2874 -1.8532 
26.2219 0.9732 24.0204 28.4233 21.0414 31.4023 -0.3219 
32.0882 0.7828 30.3175 33.8589 27:0755 37.1008 -0.0882 
26.0676 0.6919 24.5024 27.6329 21.1238 31.0114 -0.8676 
37.2524 1.3070 34.2957 40.2090 31.7086 42.7961 2.4476 
32.4879 1.4648 29.1743 35.8015 26.7459 38.2300 3.2121 
28.2032 0.9841 25.9771 30.4294 23.0122 33.3943 -1.7032 


Figura 12.1: Salida de resultados del SAS рага los datos del ejemplo 12.4. 


Más sobre el análisis de varianza en la regresión múltiple (opcional) 


En la sección 12.4 se estudió brevemente la partición de la suma total de cuadrados 
n 


Y (y; —y)? en sus dos componentes, el modelo de regresión y la suma de cuadrados del 
i=l 
error (que se ilustran en la figura 12.1). El análisis de varianza conduce a la prueba de 


Ho: Bi = B = % =- = В, = 0. 


El rechazo de la hipótesis nula implica una interpretación importante para el cientí- 
fico o el ingeniero. (A quienes les interese profundizar en el tema del uso de matrices les 
será útil estudiar el desarrollo de estas sumas de cuadrados que se usan en el ANOVA). 

En primer lugar, de la sección 12.3 recuerde que b, el vector de los estimadores de 


mínimos cuadrados, es dado por 
b = (XX) Xy. 
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Una partición de la suma de cuadrados no corregida, 


п 
2 
у'у = dy; 
i=l 
en dos componentes es dada por 


y'y =b'X'y + (уу —b'X'y) 
=y'X(X'X) Xy + ly y — y XXX) Xy]. 


El segundo término (entre corchetes) en el lado derecho es tan sólo la suma de cuadrados 
n 
del error Y (y; — $;)?. El lector debería observar que una expresión alternativa para la 


i=l 
suma de cuadrados del error es 


SCE = y'i, —-X(X'X) !Х^]у. 


El término у”Х(Х”Х)-!Х'у se denomina suma de cuadrados de la regresión. Sin em- 
n 
bargo, no se trata de la expresión У ($; —y)? que se usó para probar la “importancia” 


i=l 
de los términos b, b b , sino más bien de 


A 
y XCUX) Xy = Y 52, 
i=l 


que es la suma de cuadrados de la regresión no corregida para la media. Como tal, sólo 
se podría usar para probar si la ecuación de regresión difiere significativamente de cero, 
es decir, 


Ho: Bo = В =B = = В, = 0. 


En general, esto no es tan importante como probar 
Ho: В = == =0, 


dado que esto plantea que la respuesta media es una constante, no necesariamente сего. 


Grados de libertad 


Así, la partición de las sumas de cuadrados y los grados de libertad se reduce a 
Fuente Suma de cuadrados gl 
Regresión — »3$?=y'X(X'X)”'X'y k+1 

i=l 
Error Do = 3)? =у'П„ -XX'X) XX ']y n-(k+1) 
i=l 


Total Sy =у'у n 
і=1 


Ejercicios 
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Hipótesis de interés 


Desde luego, la hipótesis de interés para un ANOVA debe eliminar el papel de la inter- 
sección según se describió anteriormente. En términos estrictos, si Н: 8, = 8, = + = 
В, = 0, entonces la recta de regresión estimada es simplemente $, = y. Como resultado, 
en realidad se busca evidencia de que la ecuación de regresión “varíe a partir de una 
constante”. Así, la suma de cuadrados total y la suma de regresión deben corregirse para 
la media. Como resultado, tenemos 


n n n 
Yo- = У-У) +) Ооу 90). 
i=l i=l i=l 


En notación de matrices esto es simplemente 
y IL, = 10171) 1 ly = y X X'X'X' -UDT + y "IL, = ХХХ) X'y. 


En esta expresión el 1 sólo es un vector de n unos. Como resultado, simplemente resta- 


mos 5 
1 n Е 

1 1/1 _11/ pi i 
y UD Vy =- 2») 


de yy y de y"X(X"X) "Xy, es decir, corrigiendo la suma de cuadrados total y la de re- 
gresión para la media. 

Por último, la partición apropiada de las sumas de cuadrados con grados de libertad 
es como sigue: 


Fuente Suma de cuadrados gl 
Regresión Y O; – Ӱ)2 =y XXX)! X'-1(1D7l1ly k 
i=l 
Error DO -$ = у'П, —X(X'X) X'y n—(k+1) 
i=l 
Total (yi —yy = y", = 11) 1 Jy n=] 


i=l 


Ésta es la tabla ANOVA que aparece en la salida de resultados por computadora de la 
figura 12.1. Es frecuente denominar a la expresión у[1(171)-117у como la suma de 
cuadrados de la regresión asociada con la media, y se le asigna 1 grado de libertad. 


Ejercicios 


12.17 Para los datos del ejercicio 12.2 de la página 
450, estime о. 


12.18 Рага los datos del ejercicio 12.1 de la página 
450, estime о. 


12.19 Para los datos del ejercicio 12.5 de la página 
450, estime ог. 


12.20 Obtenga estimados de las varianzas y la cova- 
rianza de los estimadores b, y b,, del ejercicio 12.2 de 
la página 450. 


12.21 Remítase al ejercicio 12.5 de la página 450 y 
obtenga estimados de 


a) 0%,; 


b) Covíb,, ba). 


12.22 Para el modelo del ejercicio 12.7 de la página 
451, a un nivel de significancia de 0.05 pruebe la hipó- 
tesis de que 8, = 0, en comparación con la hipótesis 
alternativa de que 5, F 0. 
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12.23 Para el modelo del ejercicio 12.2 de la página 
450 a un nivel de significancia de 0.05, pruebe la hipó- 
tesis de que 8, = 0, en comparación con la hipótesis 
alternativa de que 8, # 0. 


12.24 Para el modelo del ejercicio 12.1 de la página 
450 pruebe la hipótesis de que 8, = 2, en comparación 
con la hipótesis alternativa de que 8, # 2. Utilice un 
valor P en sus conclusiones. 


12.25 Utilice los datos del ejercicio 12.2 de la página 
450 y el estimado de о? del ejercicio 12.17 para cal- 
cular intervalos de confianza de 95% para la respuesta 
predicha y la respuesta media cuando x, = 900 y x, = 
1.00. 


12.26 Para el ejercicio 12.8 de la página 451 cons- 
truya un intervalo de confianza de 90% para la resisten- 
cia media a la compresión cuando la concentración es 
х = 19.5 y se utiliza un modelo cuadrático. 


12.27 Utilice los datos del ejercicio 12.5 de la página 
450 y el estimado de о? del ejercicio 12.19 para cal- 
cular intervalos de confianza de 95% para la respuesta 
predicha у la respuesta media cuando х, = 75, х, = 24, 
x, = 90 y x, = 98. 


12.28 Considere los siguientes datos del ejercicio 
12.13 de la página 452. 
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xı (viscosidad 


y (desgaste) del aceite) xə (carga) 

193 1.6 851 
230 15.5 816 
172 22.0 1058 

91 43.0 1201 
113 33.0 1357 
125 40.0 1115 

a) Estime o° usando regresión múltiple de y sobre х, 
ух,. 


b) Calcule valores predichos, un intervalo de con- 
fianza de 95% para el desgaste promedio y un 
intervalo de predicción de 95% para el desgaste 
observado si x, = 20 y x, = 1000. 


12.29 Con los datos del ejercicio 12.28, y a un nivel 
de 0.05, pruebe: 


a) Ho: Bı = Оеп comparación con Hı: 6ı = 0; 
b) Но: B2 = Оеп comparación con Hı: B2 = 0. 
c) ¿Existe alguna razón para creer que habría que 


cambiar el modelo del ejercicio 12.28? Explique 
su respuesta. 


12.30 Utilice los datos del ejercicio 12.16 de la pá- 
gina 453. 
a) Estime о? usando la regresión múltiple de y sobre 
а У 
b) Calcule un intervalo de predicción de 95% para Іа 
ganancia observada con los tres regresores en x, = 
15.0, x, = 220.0 y x, = 6.0. 


12.6 Selección de un modelo ajustado mediante la prueba de hipótesis 


En muchas situaciones de regresión los coeficientes individuales revisten importancia para 
el experimentador. Por ejemplo, en una aplicación de economía, 8, B,,... podrían tener un 
significado en particular, por lo que el economista tendría un interés especial en los inter- 
valos de confianza y en las pruebas de hipótesis sobre dichos parámetros. Sin embargo, 
considere una situación de química industrial en la que el modelo propuesto supone que 
el producto de la reacción depende linealmente de la temperatura y concentración de la 
reacción de cierto catalizador. Es probable que se sepa que éste no es el verdadero modelo, 
sino una aproximación adecuada; de manera que el interés no estribaría en los parámetros 
individuales, sino en la capacidad de la función en su conjunto para predecir la respuesta 
verdadera en el rango de las variables consideradas. Por lo tanto, en esta situación, se 
pondría más énfasis en 9%, los intervalos de confianza de la respuesta media, y así suce- 
sivamente, y disminuiría el interés en las inferencias sobre los parámetros individuales. 

El experimentador que utiliza análisis de regresión también está interesado en eli- 
minar variables cuando la situación impone que, además de llegar a una ecuación de 
pronóstico funcional, debe encontrar la “mejor regresión” que implique sólo variables 
que sean predictores útiles. Se dispone de varios programas de cómputo que llegan en se- 
cuencia a la denominada mejor ecuación de regresión, dependiendo de ciertos criterios. 
En la sección 12.9 profundizaremos en el estudio de esto. 

Un criterio que suele utilizarse para ilustrar lo adecuado de un modelo ajustado de 
regresión es el coeficiente de determinación múltiple o R?. 
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Coeficiente de 
determinación 
múltiple o R? 


n a 28 2 
‚_ SCR 0 У) SCE 
STCC py STCC 
i=l 


Advierta que esta descripción se parece a la que se hizo de R? en el capítulo 11. 
En este punto la explicación podría ser más clara, toda vez que ahora nos centramos en 
SCR como la variabilidad explicada. La cantidad R? tan sólo indica qué proporción de 
la variación total de la respuesta Y es explicada por el modelo ajustado. Con frecuencia 
los experimentadores reportan R? x 100% e interpretan el resultado como el porcentaje 
de variación explicado con el modelo propuesto. La raíz cuadrada de R? se denomina 
coeficiente de correlación múltiple entre Y y el conjunto x,, х,,..., х,. En el ejemplo 
12.4 el valor de R? que indica la proporción de variación explicada por las tres variables 
independientes ху, х, y х, еѕ 


SCR 399.45 
2= 52 = 0911 
ТСС = 43813 Р 


lo cual significa que 91.17% de la variación del porcentaje de supervivencia queda expli- 
cada por el modelo de regresión lineal. 

La suma de cuadrados de regresión se puede emplear para obtener algún indicio 
acerca de si el modelo representa o no una explicación adecuada de la verdadera situa- 
ción. Podemos probar la hipótesis H, de que la regresión no es significativa con sólo 
plantear la razón 


SCR /k _ SCR Jk 


7 = SCE /п —К—1) 52 


у rechazar H, al nivel de significancia œ cuando f > f (К, n — k — 1). Para los datos del 
ejemplo 12.4 se obtiene 


_ 399.45/3 


f = gg = 309%. 


De la salida de resultados por computadora que aparece еп la figura 12.1, el valor P es 
menor que 0.0001. Esto no debe malinterpretarse. Aunque indica que la regresión expli- 
cada por el modelo es significativa, no descarta la posibilidad de que 


1. El modelo de regresión lineal en este conjunto de x no sea el único que se puede 
usar para explicar los datos; de hecho, quizás haya otros modelos con transforma- 
ciones sobre las x que generen un valor mayor para el estadístico F. 


2. El modelo podría ser más eficaz si se incluyeran otras variables, además de х, х, y 
х„ O quizá si se eliminaran una o más de las variables del modelo, por ejemplo х,, 
que tiene un valor P = 0.5916. 


El lector debería recordar el análisis de la sección 11.5 sobre las desventajas de 
utilizar R? como criterio para comparar modelos en competencia. Es evidente que dichas 
desventajas son relevantes en la regresión lineal múltiple. De hecho, los riesgos de su 
empleo en la regresión múltiple son aún mayores debido a que es muy grande la tenta- 
ción de hacer un sobreajuste. Hay que tener siempre presente que R? = 1.0 siempre puede 
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obtenerse a expensas de los grados de libertad del error cuando se emplea un exceso de 
términos en el modelo. Sin embargo, R? = 1, que describe un modelo con ajuste casi 
perfecto, no siempre genera un modelo que hace buenas predicciones. 


5 
ajus 

En el capítulo 11 se presentan varias figuras que muestran listados de resultados por 
computadora, tanto del SAS como de MINITAB, en las que aparece un estadístico lla- 
mado R? ajustado, o un coeficiente de determinación ajustado. R? ajustado es una va- 
riación de R? que proporciona un ajuste para los grados de libertad. El coeficiente de 
determinación, según se definió en la página 407, no puede disminuir a medida que se 
agregan términos al modelo. En otras palabras, Ё? по disminuye a medida que se reducen 
los grados de libertad del error n — k — 1, ya que este último resultado se produce por un 
incremento de k, el número de términos en el modelo. R? ajustado se calcula dividiendo 
la SCE y la STCC entre sus grados de libertad respectivos de la siguiente manera. 


R? ajustado 


_SCE/(n—k-—1) 
STCC /(п —1) 


R? 


ajus 


= 


Para ilustrar el uso de R? 


ajus 


se revisará el ejemplo 12.4. 


¿Cómo la eliminación de x, afecta a R? y К? 


ajus ° 
La prueba г (o la prueba F correspondiente) рага x, sugiere que un modelo más senci- 
llo que sólo implique x, y x, bien podría ser una mejoría. En otras palabras, el modelo 
completo con todos los regresores podría estar sobreajustado. Por supuesto que es in- 
teresante investigar R? у Ку, tanto para el modelo completo (x,, x, у x,) como para el 
modelo reducido (x,, х,). A partir de la figura 12.1 ya sabemos que Rc, = 0.9117. La 
SCE para el modelo reducido es 40.01, por lo que А2. = 1 — 2% = 0.9087. De esta 
forma, con x, dentro del modelo se explica más variabilidad. No obstante, como ya se 
dijo, esto ocurriría aun si el modelo estuviera sobreajustado. Desde luego que А, está 
diseñada para proporcionar un estadístico que castigue un modelo sobreajustado, de 
manera que podríamos esperar que se favorezca al modelo restringido. Entonces, para 


el modelo completo 


38.6764/9 4.2974 
Ri = Е =1= = 0.8823, 
ауе 438.1308/12 36.5109 
mientras que para el modelo reducido (eliminación de х,) 
40.01/10 4.001 
RŽ „ = 1 Е =1- ——— = 0.8904, 
12 438.1308/12 36.5109 


Así, Ка, realmente favorece el modelo reducido y confirma la evidencia proporcionada 
por las pruebas т y F, sugiriendo que el modelo reducido es preferible sobre el que 
contiene los tres regresores. El lector quizás espere que otros estadísticos sugieran el 


rechazo del modelo sobreajustado. Véase el ejercicio 12.40 de la página 471. 
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Prueba sobre un coeficiente individual 


Agregar cualquier variable sencilla a un sistema de regresión incrementará la suma de 
cuadrados de regresión y con ello se reducirá la suma de cuadrados del error. En con- 
secuencia, se debe decidir si el incremento en la regresión es suficiente para garantizar el 
uso de la variable en el modelo. Como es de esperarse, el empleo de variables sin impor- 
tancia reduciría la eficacia de la ecuación de predicción incrementando la varianza de la 
respuesta estimada. Profundizaremos más en este punto al considerar la importancia de 
x, en el ejemplo 12.4. Inicialmente podemos probar 


Но: [Вз =0, 
Hı: В #0 

usando la distribución 1 con 9 grados de libertad. Se tiene 
_b3-0 0.3433 


t= —0.556, 


в/з  2.0731/0.0886 


que indica que 8, no difiere en forma significativa de cero y, por lo tanto, bien podríamos 
sentir que se justifica eliminar x, del modelo. Suponga que se considera la regresión de 
Y sobre el conjunto (x,, x,), las ecuaciones normales de mínimos cuadrados ahora se 


reducen a 
13.0 59.43 81.82 bo 377.50 
59.43 394.7255 360.6621 bil = |1877.5670|. 
81.82 360.6621 576.7264 bz 2246.6610 


Los coeficientes de regresión estimados para este modelo reducido son 
bo = 36.094, bı = 1.031, b = —1.870, 
y la suma de cuadrados de regresión resultante, con 2 grados de libertad, es 


R(B1, B2) = 398.12. 


Aquí se utiliza la notación R(8,, @„) para indicar la suma de cuadrados de regresión del 
modelo restringido, y no debe confundirse con la SCR, es decir, la suma de cuadrados 
de regresión del modelo original con 3 grados de libertad. Entonces, la nueva suma de 
cuadrados del error es 


STCC — R (61, @&) = 438.13 — 398.12 = 40.01, 
y el cuadrado medio del error resultante, con 10 grados de libertad, es 


40.01 
2 = —— =4.001. 
+ = 70 
¿Una prueba ѓ de una variable бепе una prueba equivalente F? 


En el ejemplo 12.4 la cantidad de variación en el porcentaje de supervivencia que se 
atribuye a x,, en presencia de las variables x, y x,, es 


R(B3 | B1, B2) = SCR — R (61, B2) = 399.45 — 398.12 = 1.33, 
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que representa una pequeña proporción de toda la variación de la regresión. Esta canti- 
dad de regresión agregada, como lo indica la prueba previa sobre B,, es estadísticamente 
insignificante. Una prueba equivalente implica la formación de la razón 


RU |8.) _ 133 


s? a 020 


f 


que es un valor de la distribución F con 1 y 9 grados de libertad. Recuerde que la relación 
básica entre la distribución ѓ con v grados de libertad y la distribución F con 1 y v grados 
de libertad es 5 

t =f(1, v), 


y se observa que el valor f de 0.309 es en realidad el cuadrado del valor £ de —0.56. 
Para generalizar los conceptos anteriores podemos evaluar el funcionamiento de 
una variable independiente x, en el modelo general de regresión lineal múltiple 


HY |хухә„х, = Bo + іх +++ + Хк 


observando la cantidad de regresión atribuida a x, sobre y por arriba de la atribuida a 
las demás variables, es decir, la regresión sobre x, ajustada para las demás variables. 
Por ejemplo, se dice que x, se evalúa calculando 


R(B |6,,P3,..., B) = 8СК– К(6,, 8,,...,8,), 


donde К([,, 8,,..., 8,) es la suma de cuadrados de regresión con 8x, eliminados del 
modelo. Para probar la hipótesis 


Ho: Pi =0, 
Hı: Bı #0, 


se calcula 


_ Ё(@ | 82,8B3,...,Bx) 


52 


f 


> 


y se compara con fa(l,n — k — 1). 


Pruebas F parciales en subconjuntos de coeficientes 


De manera similar, se puede hacer una prueba para la significancia de un conjunto de las 
variables. Por ejemplo, para investigar simultáneamente la importancia de incluir x, y x, 
en el modelo se prueba la hipótesis 


Ho: В = 8 = 0, 
Н: 8, у В, no son ambas сего, 


calculando 


_ 18061,82 | B3, Bayo BE 2 [ SCR —R(B3, 34,..., Br)1/2 


52 52 


f 
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y comparando con f (2, n—Kk-— 1). El número de grados de libertad asociados con el nu- 
merador, en este caso 2, es igual al número de variables en el conjunto que se investiga. 
Suponga que se desea probar la hipótesis 


Ho: 5 = Вз = 0, 
Н: В, y В, no son ambas сего 


рага el ejemplo 12.4. Si desarrollamos el modelo de regresión 


у = бу + бух +€, 


podemos obtener R(8,) = SCR м = 187.31179. En la figura 12.1, de la página 459, 
tenemos s? = 4.29738 para el modelo completo. Por lo tanto, el valor de f para la prueba 
de hipótesis es 


_ R (B2, Вз | ßı)/2 _ [R (61, B2, B3) — R (61 )]/2 E [ SCRoompl = SCRredüc 1/2 
=> 52 Е 52 = 52 

_ (399.45437 = 187.31179) /2 — 24.68278 

Е 4.29738 7 | 


f 


Esto implica que 8, у 8, no son iguales а cero de forma simultánea. Se puede utilizar 
un programa de estadística como el SAS para obtener el resultado anterior de manera 
directa, con un valor P de 0.0002. Los lectores deben observar que en los resultados de 
los programas de estadística para computadora aparecen valores P asociados con cada 
coeficiente individual del modelo. La hipótesis nula para cada una es que el coeficiente 
es igual a cero. Sin embargo, debemos señalar que la insignificancia de cualquier co- 
eficiente no implica necesariamente que no deba ser incluido en el modelo final; sólo 
sugiere que es insignificante ante la presencia de todas las otras variables en el problema. 
El estudio de caso que se incluye al final del capítulo ilustra más esta cuestión. 


12.7 Caso especial de ortogonalidad (opcional) 


Antes de nuestro desarrollo original del problema general de regresión lineal se planteó 
la suposición de que las variables independientes se miden sin error y que con frecuen- 
cia están bajo el control del experimentador. A menudo ocurren como resultado de un 
experimento diseñado con gran detalle. De hecho, se puede incrementar la eficacia de 
la ecuación de predicción resultante utilizando un plan de experimentación adecuado. 

Suponga que nuevamente consideramos la matriz X, tal como se definió en la sec- 
ción 12.3. Podemos rescribirla como 


Х =[l,x1,x2,...,Xx), 


donde 1 representa una columna de unos y x, es un vector columna que representa los 
niveles de Xy 51 


хх, =0, раар #4, 


se dice que las variables х y x, son ortogonales entre sí. Hay ciertas ventajas evidentes 
en tener una situación completamente ortogonal, en la cual xX, =0. 
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para toda posible p y q, p + q y, además, 


aa TES AN 


ї=1 


La XX resultante es una matriz diagonal, y las ecuaciones normales de la sección 12.3 
se reducen a 


n п п А Е 
у; 2 _ 2 
nbo = Bi A= > Хур, › Хы = › Хы Yi- 
i=l a БЕП 


і=1 i=1 


Una ventaja importante es que es fácil hacer la partición de la SCR en componentes 
de un solo grado de libertad, cada uno de los cuales corresponde a la cantidad de va- 
riación de Y explicada por una variable controlada establecida. En la situación ortogonal 
se escribe 


SCR = 0 5 = Y lo + bixu + + dix — b)? 


i=l i=l 


n n n 
=й Ух}, +55) 13, ез» +5 у хы 
¡=1 


i=1 ї=1 


=R(B1) + R(B2) +*+ +R(Br). 


La cantidad R(B,) es la cantidad de la suma de cuadrados de regresión asociada con un 
modelo que implica una sola variable independiente x, 

Para probar simultáneamente la significancia de un conjunto de m variables en una 
situación ortogonal, la suma de cuadrados de regresión se convierte en 


R(B1,B2,..., Om | Bm +1) Om +2) ---> Ве) = R(B1) +R(B2) + 7 +R(Bm ), 


y, рог lo tanto, 


R(B1 | 62,8B3,..., Br) = Е(81) 


se simplifica cuando se evalúa una sola variable independiente. Por consiguiente, la 
contribución de una variable determinada o un conjunto de variables se encuentra, en 
esencia, ignorando las demás variables del modelo. Las evaluaciones independientes del 
beneficio de las variables individuales se llevan a cabo usando las técnicas de análisis de 
varianza, tal como se presentan en la tabla 12.4. La variación total en la respuesta está 
dividida en componentes de un solo grado de libertad más el término del error соп n — k 
— 1 grados de libertad. Cada valor f calculado se utiliza para probar una de las hipótesis 


Ho: В: = 0 а. 
Н: с, ES A Ку 


comparándolas con el punto crítico f (1, п — k — 1) o simplemente interpretando el 
valor Р calculado a partir de la distribución f. 
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Tabla 12.4: Análisis de varianza para variables ortogonales 


Fuente Suma de Grados de Cuadrados f 

de variación cuadrados libertad medios calculada 

Bı RB) = © х3, І К(В1) =) 
i=1 

8 RB) = B уух 1 R(B>) 800 
і=1 

Pr RB =B Уух 1 R (Bi) сш 
i=l 

Error SCE n=k-1 52 = 5, 

Total SST = Syy n—1 


Ejemplo 12.8: | Suponga que un científico recaba datos experimentales sobre el radio de un grano pro- 
pulsor, Y, en función de la temperatura del polvo, x,, la tasa de extrusión, х, y la tempe- 
ratura del molde, x,. Ajuste un modelo de regresión lineal para predecir el radio del 
grano y determine la eficacia de cada variable que interviene en el modelo. Los datos se 
presentan en la tabla 12.5. 


Tabla 12.5: Datos para el ejemplo 12.8 


Temperatura Tasa de Temperatura 
Radio del grano del polvo extrusión del molde 

82 150 (-1) 12 (-1) 220 (—1) 

93 190 (+1) 12 (-1) 220 (—1) 

114 150 (-1) 24 (+1) 220 (—1) 

124 150 (-1) 12 (-1) 250 (+1) 

111 190 (+1) 24 (+1) 220 (—1) 

129 190 (+1) 12 (—1) 250 (+1) 

157 150 (-1) 24 (+1) 250 (+1) 

164 190 (+1) 24 (+1) 250 (+1) 


Solución: Observe que cada variable está controlada en dos niveles, y que el experimento está 
compuesto por las ocho combinaciones posibles. Por conveniencia, los datos de las va- 
riables independientes se codificaron mediante las siguientes fórmulas: 


temperatura del polvo — 170 


т 20 i 
tasa de extrusión — 18 
X2 = > 
6 
temperatura del molde — 235 
Хз = . 
ñ 15 


Los niveles resultantes de x,, x, y x, toman los valores —1 y +1, tal como se indica en la 
tabla con los datos. Este diseño experimental en particular permite la ortogonalidad que 
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queremos ilustrar aquí. (En el capítulo 15 se analiza un tratamiento más completo de este 
tipo de diseño experimental). La matriz X es 


її = ЕЕ 
1 1 -1 -1 
1 -1 1 -I 
i=} = 1 
Хе i р 
тї =i 1 
1—1 1 1 
11 1 1 


y las condiciones de ortogonalidad se verifican con facilidad. 
Ahora podemos calcular los coeficientes 


8 8 
1 1 
ж?з yi = 121.75, b = bans 025, 
8 8 
b a „МР ИБ b Е офи 
к ша а И эсе. 


de manera que, en términos de las variables codificadas, la ecuación de predicción es 
Y =121.75+2.5x1 + 14.75x2 + 21.75 x3. 


El análisis de varianza de la tabla 12.6 presenta las contribuciones independientes a la 
SCR de cada variable. Cuando los resultados se comparan con f, (1.4), cuyo valor es 
7.71, indican que х, no contribuye de manera significativa a un nivel de 0.05; mientras que 
las variables x, y x, sí son significativas. En este ejemplo el estimado para g? es 23.1250. 
Igual que en el caso de una sola variable independiente, se debe señalar que este estimado 
no sólo contiene variación por el error experimental, a menos que el modelo postulado sea 
correcto. De otra manera, el estimado estará “contaminado” por la falta de ajuste, además 
del error puro, y la falta de ajuste sólo se puede separar si se obtienen múltiples observa- 
ciones experimentales para las distintas combinaciones (x, х,, х,). 


Tabla 12.6: Análisis de varianza para los datos del radio de los granos 


Fuente Suma de Grados de Cuadrados ГА 

де уагіасібп cuadrados libertad medios calculada Valor P 
Ві (2.5)2(8) = 50.00 1 50.00 2.16 0.2156 
Ba (14.75)2(8) = 1740.50 1 1740.50 75.26 0.0010 
бз (21.75)2(8) = 3784.50 1 3784.50 163.65 0.0002 
Error 92.50 4 23.13 
Total 5667.50 7 


Como x, no es significativa, simplemente se puede eliminar del modelo sin alterar 
los efectos de las otras variables. Observe que tanto x, como x, tienen un efecto positivo 
sobre el radio del grano, pero x, es el factor más importante debido a la pequeñez de su 
valor P. 


Ejercicios 


Ejercicios 


12.31 Calcule e interprete el coeficiente de determi- 
nación múltiple para las variables del ejercicio 12.1 de 
la página 450. 

12.32 Pruebe si la regresión explicada por el modelo 
del ejercicio 12.1, que se encuentra en la página 450, es 
significativa a un nivel de significancia de 0.01. 


12.33 Pruebe si la regresión explicada por el modelo 
del ejercicio 12.5, de la página 450, es significativa a un 
nivel de significancia de 0.01. 


12.34 Para el modelo del ejercicio 12.5 de la página 
450 pruebe la hipótesis 


Но: В =Q = 0, 


Hı: Bı y % no son ambas cero. 


12.35 Repita el ejercicio 12.17 de la página 461 
usando el estadístico F. 


12.36 Se realizó un pequeño experimento para ajus- 
tar una ecuación de regresión múltiple que relaciona 
el producto, y, con la temperatura, x,, el tiempo de re- 
acción, х„ y la concentración de uno de los reactantes, 
х,. Se eligieron dos niveles de cada variable y se regis- 
traron las siguientes mediciones correspondientes a las 
variables independientes codificadas: 


y Х\ X2 X3 
7.6 1 1 1 
8.4 1 —1 —1 
9.2 —1 1 —1 
10.3 —1 —1 1 
9.8 1 1 —1 
11.1 1 —1 1 
10.2 —1 1 1 
12.6 1 1 1 


a) Utilice las variables codificadas para estimar la 
ecuación de regresión lineal múltiple 


Шуко хз = Во + Bix + Pox2 + P3X3. 


b) Divida la SCR, es decir, la suma de cuadrados de 
regresión, en tres componentes de un solo grado 
de libertad atribuibles а x,, х, y x, respectiva- 
mente. Construya una tabla de análisis de varianza 
que indique las pruebas de significancia para cada 
variable. 

12.37 Considere los datos de energía eléctrica del 
ejercicio 12.5 de la página 450. Pruebe Н: В, = В, = 
0 utilizando R(8,, 8, | B,, B,). Proporcione un valor Ру 
saque conclusiones. 


12.38 Considere los datos del ejercicio 12.36. Calcule 
lo siguiente: 
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R(B1 | Bo), R(B1 | Bo, Pa, B3), 
R(P2 | Во, В),  R(B2 | Bo, B1, 83), 
Е(@Ө» | Во, B1, B2), Е(81, Ba | Pa). 


Haga comentarios al respecto. 


12.39 Considere los datos del ejercicio 11.55 de la 
página 437. Ajuste un modelo de regresión utilizando 
el peso y el cociente de manejo como variables explica- 
tivas. Compare este modelo con el de la RLS (regresión 
lineal simple) utilizando sólo el peso. Utilice А, К^ у 
cualquier estadístico £ (o F) que necesite para comparar 
la RLS con el modelo de regresión múltiple. 


12.40 Considere el ejemplo 12.4. La figura 12.1 de la 
página 459 presenta una salida de resultados del SAS 
para un análisis del modelo que contiene las variables 
хь X, y х,. Céntrese en el intervalo de confianza de la 
respuesta media u, en las ubicaciones (x,, х,, x,) que 
representan los 13 puntos de los datos. Considere el 
elemento en la salida de resultados indicado con C.V., 
que representa al coeficiente de variación, el cual se 
define como 


C.V. = = · 100, 


ia 


donde s=yVs? es la raíz del cuadrado medio del 
error. El coeficiente de variación se utiliza con fre- 
cuencia como otro criterio para comparar modelos en 
competencia. Se trata de una cantidad sin escala que 
expresa al estimado de с, es decir, s, como un porcen- 
taje de la respuesta promedio y. Al competir por el “те- 
jor” modelo de un grupo de modelos en competencia se 
busca un modelo con un valor pequeño de C.V. Haga 
un análisis de regresión del conjunto de datos que se 
presenta en el ejemplo 12.4, pero elimine x,. Compare 
el modelo completo (x, x,, x,) con el restringido 
(x x,) y céntrese en dos criterios: 1) C.V.; ii) la anchura 
de los intervalos de confianza sobre u,. Para el segundo 
criterio usted quizá desearía usar la anchura promedio. 
Haga comentarios al respecto. 


12.41 Considere el ejemplo 12.3 de la página 447. 
Compare los dos modelos en competencia 

Primer orden: y; = @+{х + 8х2; + €i, 
Segundo orden: у; = Во + х1 + Хэ 


+ 811 xii + ЖИ + Bi2X1iX2i +6. 
Utilice Ru para realizar la comparación. Pruebe Н; 
Ba = ba = B,, = 0. También utilice el С.У. que se 
mencionó en el ejercicio 12.40. 
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12.42 En el ejemplo 12.8 se trata el caso de eliminar 
del modelo x,, que representa la temperatura del polvo, 
ya que el valor P basado en la prueba F es 0.2156, en 
tanto que los valores P para x, y x, son Casi cero. 

а) Reduzca el modelo eliminando x,, después genere 
un modelo completo y uno restringido (o redu- 
cido), y compárelos basándose en Ris 

b) Compare los modelos completo y restringido 
usando intervalos de predicción de 95% de an- 
cho sobre una nueva observación. El “mejor” de 
ambos modelos será aquel con intervalos de pre- 
dicción más “estrechos”. Utilice el promedio del 
ancho de los intervalos de predicción. 


12.43 Considere los datos del ejercicio 12.13 de la 
página 452. ¿La respuesta, o sea el uso, se puede ex- 
plicar en forma adecuada mediante una sola variable 
(ya sea la viscosidad o la carga) con una RLS en vez de 
con la regresión completa con dos variables? Justifique 
su respuesta con pruebas de hipótesis, así como con la 
comparación de los tres modelos en competencia. 


12.44 Para el conjunto de datos que se da en el ejer- 
cicio 12.16 de la página 453, ¿es posible explicar la 
respuesta en forma adecuada usando dos variables re- 
gresoras cualesquiera? Analice el problema. 


12.8 Variables categóricas o indicadoras 


Un caso especial de aplicación muy importante de la regresión lineal múltiple ocurre 
cuando una o más de las variables regresoras son variables categóricas, indicadoras o 
ficticias. Es probable que en un proceso químico el ingeniero desee modelar el producto 
del proceso en comparación con regresores tales como la temperatura del proceso y el 
tiempo de reacción. Sin embargo, hay interés por el uso de dos catalizadores diferentes 
y por incluir de algún modo el “catalizador” en el modelo. El efecto del catalizador no 
se puede medir sobre un continuo, de manera que es una variable categórica. Un analista 
podría desear modelar el precio de casas en comparación con regresores que incluyan 
los pies cuadrados de superficie habitable, х, la superficie del terreno, x,, y la antigüedad 
de la vivienda, Xy: Estos regresores son de naturaleza claramente continua. Sin embargo, 
es evidente que el costo de las casas podría variar en forma sustancial de una zona del 
país a otra. Si reuniéramos datos acerca de casas en el este, el medio oeste, en el sur y en 
el oeste, tendríamos una variable indicadora con cuatro categorías. En el ejemplo del 
proceso químico, si utilizáramos dos catalizadores tendríamos una variable indicadora 
con dos categorías. En un ejemplo biomédico, donde se compara un medicamento con 
un placebo, a todos los sujetos se les evalúa con varias mediciones continuas, como su 
edad, presión sanguínea, etcétera, al igual que el género, que por supuesto es una varia- 
ble categórica con dos categorías. De esta manera, además de las variables continuas 
existen dos variables indicadoras, el tratamiento con dos categorías (medicamento activo 
y placebo) y el género con dos categorías (hombre y mujer). 


Modelo con variables categóricas 


Para ilustrar la forma en que las variables indicadoras participan en el modelo utiliza- 
remos el ejemplo del proceso químico. Suponga que y = producto, x, = temperatura y 
x, = tiempo de reacción. Ahora denotaremos con z la variable indicadora. Sea z = 0 
para el catalizador 1 y z = 1 para el catalizador 2. La asignación del indicador (0, 1) al 
catalizador es arbitraria. Como resultado, el modelo se convierte en 


yi = Во + ух + хо: +B3zi + е, і = 1,2,..., п. 


Tres categorías 


Continuamos aplicando la estimación de los coeficientes con el método de los mínimos 
cuadrados. En el caso de tener tres niveles o categorías de una sola variable indicadora, 
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el modelo incluirá dos regresores, digamos z, y 2,, donde la asignación (0, 1) es como 
sigue: 
1 


оон м 


donde 0 y 1 son vectores de ceros y unos, respectivamente. En otras palabras, si hay £ 
categorías, el modelo incluye £ — 1 términos reales. 

Puede ser aleccionador observar la representación gráfica del modelo con 3 cate- 
gorías. En aras de la simplicidad, se considerará una sola variable continua x. Como 
resultado, el modelo quedará representado como 


у = Во + Bix; + 821: + 32 + єг. 


Así, la figura 12.2 refleja la naturaleza del modelo. Las siguientes son expresiones del 
modelo para las tres categorías. 


E(Y) = (бу + B2) + Bix, categoría 1, 

E(Y) = (Bo + 8з) + Pix, categoría 2, 

E(Y) = bo + бух, categoría 3. 
Como resultado, el modelo que incluye variables categóricas en esencia implica un cam- 
bio en la intersección a medida que se pasa de una categoría a otra. Desde luego, aquí 


se asume que los coeficientes de las variables continuas son los mismos entre las 
categorías. 


Categoría 1 


Categoría 2 


Categoría 3 


Figura 12.2: Caso de tres categorías. 


Ejemplo 12.9: | Considere los datos de la tabla 12.7. La respuesta y es la cantidad de sólidos en suspen- 
sión en un sistema de limpieza de carbón. La variable x es el pH del sistema y se utilizan 
tres polímeros diferentes. Así, “polímero” es categórico con tres categorías, de manera 
que produce dos términos en el modelo, el cual queda como 


yi = Во + ух; + 821; + Baza + €)  1¿=1,2,...,18. 
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Luego, tenemos 


0, en cualquier caso, 


1, para el polímero 1, 1, para el polímero 2, 
E. = 
à 0, en cualquier caso. 


A partir del análisis de la figura 12.3 se sacan las siguientes conclusiones. El coefi- 
ciente b, para el pH es el estimado de la pendiente común que se asume en el análisis de 
regresión. Todos los términos del modelo son estadísticamente significativos. Así, el pH 
y la naturaleza del polímero tienen un efecto sobre la cantidad de limpieza. Los signos 
y las magnitudes de los coeficientes de z, y z, indican que el polímero más eficaz para la 
limpieza es el polímero 1 (produce más sólidos en suspensión), seguido por el polímero 
2, y que el menos eficaz es el polímero 3. 


Tabla 12.7: Datos para el ejemplo 12.9 


x (pH) у (cantidad de sólidos en suspensión) Polímero 
6.5 292 1 
6.9 329 1 
7.8 352 1 
8.4 378 1 
8.8 392 1 
9.2 410 1 
6.7 198 2 
6.9 227 2 
7.5 217 2 
7.9 297 2 
8.7 364 2 
92 375 2 
6.5 167 3 
7.0 225 3 
7.2 247 3 
7.6 268 3 
8.7 288 3 
9.2 342 3 


La pendiente puede variar con las categorías indicadoras 


En el análisis efectuado hasta el momento se ha supuesto que los términos de las varia- 
bles indicadoras entran al modelo en forma aditiva, lo cual sugiere que las pendientes, 
como las que se aprecian en la figura 12.2, son constantes en todas las categorías. Es 
evidente que éste no siempre será el caso. Existe la posibilidad de que las pendientes 
varíen y realmente se ponga a prueba esta condición de paralelismo al incluir términos 
de producto o interacción entre los términos indicadores y las variables continuas. Por 
ejemplo, suponga que se eligen un modelo con un regresor continuo y una variable indi- 
cadora con dos niveles. El modelo entonces quedaría como sigue 


y = Bo + Bix + 82 + 83х@ +e. 
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Sum of 
Source DF Squares Mean Square F Value Pr > F 
Mode 1 3 80181.73127 26727.24376 73.68 <.0001 
Error 14 5078.71318 362.76523 


Corrected Total 17 85260.44444 


R-Square Coeff Var Root MSE y Mean 
0.940433 6.316049 19.04640 301.5556 
Standard 
Parameter Estimate Error t Value Рг > |+| 
Intercept -161.8973333 37.43315576 -4.32 0.0007 
х 54.2940260 4.75541126 11.42 <.0001 
21 89.9980606 11.05228237 8.14 <.0001 
22 27.1656970 11.01042883 2.47 0.0271 


Figura 12.3: Salida de resultados del SAS para el ejemplo 12.9. 


Este modelo sugiere que para la categoría 1 (z = 1), 


Е(у) = ( + P2) + (81 + B3)x, 


mientras que para la categoría 2 (z = 0), 


E) = Po + Bix. 


Por consiguiente, se permite que varíen la intersección y las pendientes para las dos ca- 
tegorías. En la figura 12.4 se presentan las rectas de regresión con pendientes variables 
para las dos categorías. 


y 
Categoría 1: pendiente = 81+ B3 
Categoría 2: pendiente = By 
Ba 
Bo 


X 
Figura 12.4: Falta de paralelismo en las variables categóricas. 
En este caso 6,, 8, у B, son positivas, mientras que 6, es negativa con |B,| < 6.. 


Por supuesto, si el coeficiente de interacción P, es insignificante, regresamos al modelo 
común de la pendiente. 
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Ejercicios 


12.45 Se realizó un estudio para evaluar el combus- 
tible que se ahorra al conducir un automóvil sedán 
de cuatro puertas en vez de una camioneta o un SUV 
(vehículo deportivo utilitario). Las variables continuas 
son la lectura del odómetro y el octanaje de la gasolina 
empleada. La variable de respuesta se da en millas por 
galón. Los datos se presentan a continuación. 


Tipo de 
MP automóvil Odómetro  Octanaje 
34.5 sedan 75,000 87.5 
33.3 sedan 60,000 87.5 
30.4 sedan 88,000 78.0 
32.8 sedan 15,000 78.0 
35.0 sedan 25,000 90.0 
29.0 sedan 35,000 78.0 
32.5 sedan 102,000 90.0 
29.6 sedan 98,000 87.5 
16.8 van 56,000 87.5 
19.2 van 72,000 90.0 
22.6 van 14,500 87.5 
24.4 van 22,000 90.0 
20.7 van 66,500 78.0 
25.1 van 35,000 90.0 
18.8 van 97,500 87.5 
15.8 van 65,500 78.0 
17.4 van 42,000 78.0 
15.6 SUV 65,000 78.0 
17:3 SUV 55,500 87.5 
20.8 SUV 26,500 87.5 
22.2 SUV 11,500 90.0 
16.5 SUV 38,000 78.0 
21.3 SUV 77,500 90.0 
20.7 SUV 19,500 78.0 
24.1 SUV 87,000 90.0 


a) Ajuste un modelo de regresión lineal que incluya 
dos variables indicadoras. Utilice (0, 0) para deno- 
tar al sedán de cuatro puertas. 

b) ¿Qué tipo de vehículo parece tener un mayor ren- 
dimiento del combustible? 
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c) Analice la diferencia entre una camioneta y un 
SUV en términos del rendimiento del combus- 
tible. 


12.46 Se efectuó un estudio para determinar si el 
género del titular de la tarjeta de crédito era un factor 
importante en la generación de utilidades para cierta 
empresa de tarjetas de crédito. Las variables conside- 
radas fueron el ingreso, el número de miembros de la 
familia y el género del titular de la tarjeta. Los datos 
son los siguientes: 


Miembros de 


Utilidad Ingreso Género Іа familia 
157 45,000 M 1 
—181 55,000 M 2 
—253 45,800 M 4 
158 38,000 M 3 
75 75,000 M 4 
202 99,750 M 4 
—451 28,000 M 1 
146 39,000 M 2 
89 54,350 M 1 
—357 32,500 M 1 
522 36,750 F 1 
78 42,500 F 3 
5 34,250 F 2 
—177 36,750 F 3 
123 24,500 F 2 
251 27,500 F 1 
—56 18,000 F 1 
453 24,500 Е 1 
288 88,750 F 1 
—104 19,750 F 2 


a) Ajuste un modelo de regresión lineal usando las 
variables disponibles. Con base en el modelo ajus- 
tado, ¿la empresa preferiría clientes del género 
masculino o del femenino? 

b) ¿Diría usted que el ingreso fue un factor impor- 
tante para explicar la variabilidad de la utilidad? 


Métodos secuenciales para la selección del modelo 


En ocasiones las pruebas de significancia estudiadas en la sección 12.6 son muy ade- 
cuadas para determinar cuáles variables se deben usar en el modelo final de regresión. 
Dichas pruebas sin duda son eficaces si el experimento se puede planear y las variables 
son ortogonales entre sí. Incluso si las variables no son ortogonales, las pruebas ї indi- 
viduales se pueden usar en muchos problemas en donde se investigan pocas variables. 
Sin embargo, existen muchos problemas en los que es necesario utilizar técnicas más 
elaboradas para seleccionar las variables, en particular si el experimento exhibe una 
desviación sustancial de la ortogonalidad. Los coeficientes de correlación de la muestra 
г х, proporcionan medidas útiles de multicolinealidad (dependencia lineal) entre las 
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variables independientes. Como sólo estamos interesados en la dependencia lineal en- 
tre variables independientes, no nos confundiremos si eliminamos las x de la notación y 
sólo escribimos г, х, = гу, donde 

Si 

Sä Sjj 


rij = 


Observe que, en sentido estricto, las ғ, no proporcionan estimados verdaderos de 
los coeficientes de correlación de la población, ya que las x en realidad no son variables 
aleatorias en el contexto que se estudia aquí. Así, el término correlación, aunque están- 
dar, quizá sea inadecuado. 

Cuando uno o más de esos coeficientes de correlación muestral se desvía de manera 
sustancial de cero, suele ser muy difícil encontrar el subconjunto de variables más eficaz 
para incluirlo en la ecuación de predicción. De hecho, en ciertos problemas la multicoli- 
nealidad es tan extrema que no es posible encontrar un predictor adecuado, a menos que 
se investiguen todos los subconjuntos posibles de variables. En la bibliografía se citan 
los análisis informativos de Hocking (1976) para la selección de modelos de regresión. 
En la obra de Myers (1990), también citado, se estudian procedimientos para detectar la 
multicolinealidad. 

El usuario de la regresión lineal múltiple busca lograr uno de tres objetivos: 


1. Obtener estimados de coeficientes individuales en un modelo completo. 


2. Estudiar variables para determinar cuáles tienen un efecto significativo sobre la 
respuesta. 


3. Calcular la ecuación de predicción más eficaz. 


En 1) se sabe de antemano que todas las variables deben incluirse en el modelo. En 2) la 
predicción es secundaria; mientras que en 3) los coeficientes de regresión individuales 
no son tan importantes como la calidad de la respuesta estimada Ў. Para cada una de las 
situaciones anteriores la multicolinealidad en el experimento puede tener un efecto pro- 
fundo sobre el éxito de la regresión. 

En esta sección se estudian algunos procedimientos secuenciales estándar para se- 
leccionar variables, los cuales se basan en la idea de que una sola variable o un conjunto 
de ellas no debería aparecer en la ecuación de estimación, a menos que origine un in- 
cremento significativo en la suma de cuadrados de regresión o, en forma equivalente, un 
incremento significativo de R?, el coeficiente de determinación múltiple. 


Ilustración de la selección de las variables en presencia de colinealidad 


Ejemplo 12.10: | Considere los datos de la tabla 12.8, que muestra mediciones de 9 bebés. El objetivo del 
experimento era calcular una ecuación de estimación apropiada que relacionara la talla 
del bebé con todas las variables independientes o un subconjunto de ellas. Los coeficien- 
tes de correlación muestral, que indican la dependencia lineal entre las variables inde- 
pendientes, se incluyen en la matriz simétrica 


X1 Хэ Хз X4 
1.0000 0.9523 0.5340 0.3900 
0.9523 1.0000 0.2626 0.1549 
0.5340 0.2626 1.0000 0.7847 
0.3900 0.1549 0.7847 1.0000 
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Tabla 12.8: Datos relacionados con la talla de bebés* 


Talla del bebé, Edad, Talla al nacer, Peso al nacer, Tamaño del pecho 
y (cm) xı (días) x (cm) x3 (kg) al nacer, x4 (cm) 
57.5 78 48.2 2.75 29.5 
52.8 69 45.5 2.15 26.3 
61.3 77 46.3 4.41 32.2 
67.0 88 49.0 5.52 36.5 
53.5 67 43.0 3.21 27.2 
62.7 80 48.0 4.32 27.7 
56.2 74 48.0 2.31 28.3 
68.5 94 53.0 4.30 30.3 
69.2 102 58.0 3.71 28.7 


*Datos analizados por el Statistical Consulting Center, Virginia Tech, Blacksburg, Virginia. 


Observe que parece haber una cantidad apreciable de multicolinealidad. Se utilizó la 
técnica de mínimos cuadrados descrita en la sección 12.2 y se usó el modelo completo 
para ajustar la ecuación de regresión estimada, la cual quedó como sigue: 


Y = 7.1475 + 0.1000х + 0.7264x2 + 3.0758x3 — 0.0300x4. 


El valor de s? con 4 grados de libertad es 0.7414, y se encontró que el valor del coefi- 
ciente de determinación para este modelo es 0.9908. En la tabla 12.9 se proporciona la 
suma de cuadrados de regresión que mide la variación atribuida a cada variable indivi- 
dual en presencia de las demás, así como los valores £ correspondientes. 


Tabla 12.9: Valores t para los datos de regresión de la tabla 12.8 


Variable xı Variable x, Variable x3 Variable x4 
R(8, | B» e R(B>|81,B3,B4) КО: | 61, 62,864) КОВ, | Тл 
= 0.0 = 0.6334 = 6.2523 = 0.0 
і = с t = 0.9243 t = 2.9040 = о 


Una región crítica de dos colas, con 4 grados de libertad y un nivel de significancia 
de 0.05, es dada por |4 > 2.776. De los cuatro valores £ calculados sólo la variable х, 
parece ser significativa. Sin embargo, recuerde que aunque el estadístico t descrito en 
la sección 12.6 mide el beneficio que aporta una variable ajustada a todas las demás, no 
detecta la importancia potencial de una variable en combinación con un subconjunto de 
variables. Por ejemplo, considere el modelo sólo con las variables x, y x, en la ecuación. 
El análisis de los datos proporciona la función de regresión 


$ = 2.1833 + 0.9576x2 + 3.3253x3, 


con R? = 0.9905, que por supuesto no es una reducción sustancial de R? = 0.9907 para 
el modelo completo. Sin embargo, a menos que las características del desempeño de 
esta combinación particular hayan sido observadas, no estaríamos conscientes de su 
potencial predictivo. Esto, desde luego, apoya una metodología que observe todas las 
regresiones posibles, o un procedimiento secuencial sistemático diseñado para probar 
subconjuntos diferentes. 


12.9 Métodos secuenciales para la selección del modelo 479 


Regresión por etapas 


Un procedimiento estándar para buscar el “subconjunto óptimo” de variables ante la 
ausencia de ortogonalidad es una técnica denominada regresión por etapas, que se 
basa en el procedimiento de introducir en forma secuencial las variables al modelo, 
una por una. Dado un tamaño œ predeterminado, la descripción de la rutina por etapas 
se entenderá mejor si primero se describen los métodos de selección hacia delante y 
eliminación hacia atrás. 

La selección hacia delante se basa en el concepto de que las variables deben inser- 
tarse una por una hasta obtener una ecuación de regresión satisfactoria. El procedimiento 
es como sigue: 


PASO 1. Elija la variable que proporcione la mayor suma de cuadrados de regre- 
sión cuando se ejecute la regresión lineal simple con y o, en forma equivalente, 
aquella que proporcione el mayor valor de А. Esta variable inicial se llamará х. 
Si x, es insignificante, el procedimiento se suspende. 


PASO 2. Seleccione la variable que al ser integrada al modelo proporciona el 
mayor incremento de А, en presencia de x , sobre Іа R? encontrada en el paso 1. 
Esta, por supuesto, es la variable x, para la que 


R(6; 181) = К(81,8;) — (81) 


es más grande. Dicha variable se llamará x,. Luego se ajusta el modelo de regresión 
con x, y x,, y se observa R?. Si x, es insignificante, el procedimiento se suspende. 


PASO 3. Elija la variable x, que proporciona el valor más grande de 
R(Bj 181.82) = R (61, 8,85) — R (B1, 82), 


otra vez da como resultado el incremento mayor de R? sobre el que se obtuvo en el 
paso 2. A esta variable se le denomina х,у ahora se tiene un modelo de regresión 
que incluye x,, x, ух,. Si x, es insignificante, el procedimiento se suspende. 


Este proceso continúa hasta que la variable más reciente incluida ya no produce un 
incremento significativo en la regresión explicada. Tal incremento se puede determinar 
en cada paso utilizando adecuadamente una prueba F o una prueba ѓ parciales. Por ejem- 
plo, en el paso 2 el valor 


R 
t= 0) 


se determina para probar la pertinencia de х, еп el modelo. Aquí, el valor de 5? es el 
cuadrado medio del error рага el modelo que contiene las variables x, y х,. De manera 
similar, en el paso 3 la razón 


p -RO 18.8) 


prueba la pertinencia de х, еп el modelo. Sin embargo, ahora el valor de 52 es el cuadrado 
medio del error para el modelo que contiene las tres variables х, x, y Хх, Si en el paso 2, 
f< f (l, п — 3) para un nivel de significancia preseleccionado, х, no está incluida y el 
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proceso finaliza, lo que da como resultado una ecuación lineal simple que relaciona y y 
х,. Sin embargo, si f > f (1, n — 3), se avanza al paso 3. De nuevo, si en el paso 3, f < 
ХЛ, п — 4), entonces x, ho se incluye y el proceso termina con la ecuación de la regre- 
sión apropiada que contiene las variables x, y х,. 

La eliminación hacia atrás implica los mismos conceptos que la selección hacia 
delante, excepto que se comienza con todas las variables en el modelo. Por ejemplo, 
suponga que hay cinco variables en consideración. Los pasos son: 


PASO 1. Ajuste una ecuación de regresión con las cinco variables incluidas en 
el modelo. Elija la variable que proporcione el valor más pequeño de la suma de 
cuadrados de regresión ajustada para las demás. Suponga que dicha variable es 
x,. Elimine x, del modelo si 


_ КОВ | б, бз, Ba, Ps) 


s2 


J 


es insignificante. 


PASO 2. Ajuste una ecuación de regresión utilizando las variables restantes Xo Xy 
x, y X, y repita el paso 1. Suponga que esta vez elige la variable х. Nuevamente, si 


_R(Bs | Br, B3, Pa) 
= AAA 
$ 
es insignificante, se retira del modelo la variable x_. En cada paso la 5? que se 
usa en la prueba F es el cuadrado medio del error para el modelo de regresión 
en esa etapa. 


Este proceso se repite hasta que en algún paso la variable con la suma de cuadrados 
de regresión ajustada más pequeña produce un valor f significativo a un nivel de signifi- 
cancia predeterminado. 

La regresión por etapas se lleva a cabo con una modificación ligera pero impor- 
tante del procedimiento de selección hacia delante. La modificación requiere efectuar 
más pruebas en cada etapa para garantizar la eficacia continuada de las variables que 
se hubieran incluido en el modelo durante alguna etapa anterior. Esto representa una 
mejoría sobre la selección hacia delante, ya que es muy posible que una variable que 
haya entrado a la ecuación de regresión en una etapa temprana resulte poco importan- 
te o redundante debido a las relaciones que existen entre ella y las otras variables que se 
incluyeron en etapas posteriores. Por lo tanto, en la etapa en que se incluyó una varia- 
ble nueva a la ecuación de regresión mediante un incremento significativo de R?, según 
lo determina la prueba F, todas las variables que ya estén en el modelo se someten a 
pruebas F (о bien, a pruebas 1) a la luz de esta nueva variable, y si no muestran un valor 
f significativo, se eliminan. El procedimiento continúa hasta que se alcance una etapa 
donde ya no sea posible insertar ni eliminar variables adicionales. Este procedimiento 
por etapas se ilustra con el siguiente ejemplo. 


Ejemplo 12.11: | Utilice las técnicas de regresión por etapas y calcule un modelo de regresión lineal ade- 


cuado para predecir la talla de los bebés cuyos datos se presentan en la tabla 12.8. 
PASO 1. Se considera cada variable por separado y se ajustan cuatro ecuaciones 
individuales de regresión lineal simple. Se calculan las siguientes sumas de cua- 
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drados de regresión pertinentes: 


R(B1) = 288.1468,  R(@) = 215.3013, 
R(B3) = 186.1065, R (B4) = 100.8594. 


Es evidente que la variable x, proporciona la suma de cuadrados de regresión más 
elevada. El cuadrado medio del error para la ecuación que implica sólo x, es 5? = 


4.7276, y como 
R(81) _ 288.1468 


s2 4,7276 


fe = 60.9500, 


que excede a f, ol» 7) = 5.59, la variable x, es significativa y se introduce al mo- 
delo. 


PASO 2. En esta etapa se ajustan tres ecuaciones de regresión y todas incluyen a 
x,. Los resultados importantes para las combinaciones (x,, х,), (х,, x) у(х, Хх) son 


R(8218,) = 23.8703, R(83181) = 29.3086, R(Ba|B1) = 13.8178. 


La variable x, muestra la mayor suma de cuadrados de regresión en presencia de 
x La regresión que implica x, y х, proporciona un valor nuevo de 5° = 0.6307, у 


como 

R(B3181) _ 29.3086 
s? 0.6307 
que excede a f ah 6) = 5.99, la variable x, es significativa y se incluye en el 


modelo junto соп x,. Ahora debemos someter a х, a una prueba de significancia en 
presencia de x,. Encontramos que R(fB, | P,) = 131.349, en consecuencia, 


f= = 46.47, 


R(BilBs) _ 131.349 _ 
= 2 = 06307 a 


que es muy significativa. Por lo tanto, se mantiene х, junto con x,. 


PASO 3. Con х, у х, incluidas en el modelo, ahora se requiere К([, | 6p P,) y 
R(B,|P, B,) para determinar cuál de las dos variables restantes, si es que acaso 
se puede incluir alguna, se debe incluir en esta etapa. Del análisis de regresión, 
usando x, junto con x, y x,, se observa que R(B, | 6, 8,) = 0.7948, y cuando х, se 
utiliza con x, y x, se obtiene R(8B, | 6p 8.) = 0. 1855. El valor de s? es 0.5979 para 
la combiñación (Хх, Xy» X3), y O. 7198 para la combinación (x,, х,, х„). Como ningún 
valor fes significativo al nivel œ = 0.05, el modelo final de regresión sólo incluye 
las variables x, y х,. Se encuentra que la ecuación de estimación es 


$ = 20.1084 + 0.4136x 1 + 2.0253x3, 


y el coeficiente de determinación para este modelo es R? = 0.9882. 


Aunque (x,, x,) es la combinación elegida mediante la regresión por etapas, no es 
necesariamente la combinación de dos variables que proporciona el valor más grande de 
К°. De hecho, ya observamos que la combinación (х, х.) da un valor de R? = 0.9905. 
Desde luego, el procedimiento por etapas nunca tomó en cuenta dicha combinación. Se 
podría plantear un argumento racional de que en realidad hay una diferencia desprecia- 
ble en el desempeño entre esas dos ecuaciones de estimación, al menos en términos del 
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porcentaje de variación explicado. Sin embargo, es interesante observar que el proce- 
dimiento de eliminación hacia atrás proporciona la combinación (x,, x,) en la ecuación 
final (véase el ejercicio 12.49 en la página 494). J 


La función principal de cada uno de los procedimientos explicados en esta sección con- 
siste en exponer las variables a una metodología sistemática, diseñada para garantizar 
la inclusión final de las mejores combinaciones de las mismas. Es evidente que no es 
seguro que esto pase en todos los problemas y, por supuesto, es posible que la multicoli- 
nealidad sea tan extensa que no haya más alternativa que apoyarse en procedimientos de 
estimación diferentes de los mínimos cuadrados. Tales procedimientos de estimación se 
estudian en Myers (1990), listado en la bibliografía. 

Los procedimientos secuenciales que se estudian aquí son tres de los muchos méto- 
dos de ese tipo que aparecen en la literatura y que están incluidos en diversos paquetes 
de regresión por computadora. Estos métodos fueron diseñados para ser eficientes en 
cuanto al cálculo pero, por supuesto, no proporcionan resultados para todos los subcon- 
juntos posibles de variables. Debido a esto los procedimientos son más eficaces para 
conjuntos de datos que incluyen un número grande de variables. En el caso de los pro- 
blemas de regresión que implican un número relativamente pequeño de variables, los 
paquetes modernos de cómputo para la regresión permiten el cálculo y resumen la infor- 
mación cuantitativa de todos los modelos para cada subconjunto posible de variables. En 
la sección 12.11 se proporcionan ilustraciones. 


Elección de valores P 


Como es de esperarse, la elección del modelo final con estos procedimientos podría 
depender en gran medida del valor P que se seleccione. Además, un procedimiento es 
más exitoso cuando es forzado a probar una gran cantidad de variables posibles. Por 
esta razón, cualquier procedimiento hacia delante es más útil cuando se utiliza un valor 
P relativamente grande. Á esto se debe que algunos programas de cómputo empleen un 
valor P predeterminado de 0.50. 


12.10 Estudio de los residuales y violación de las suposiciones 
(verificación del modelo) 


Anteriormente en este capítulo se sugirió que los residuales, o errores en el ajuste de 
regresión, con frecuencia proporcionan información que puede ser muy valiosa para el 
analista de datos. Los e, = y, = ӯ, і = 1, 2,..., п, que son el equivalente numérico de los 
€, los errores del modelo, a menudo revelan la posible violación de las suposiciones o la 
presencia de datos de puntos “sospechosos”. Suponga que el vector x, denota los valores 
de las variables regresoras que corresponden al ¡-ésimo punto de los datos, complemen- 
tado por un 1 en la posición inicial. Es decir, 


ГА 
х; =[L,x1;,X2;,..->Xgi 1. 
Considere la cantidad 


hi=x (XX) x;  ¡=1,2,..n. 
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El lector debería notar que en la sección 12.5 se utilizó Л, рага calcular los intervalos de 
confianza de la respuesta media. Además de 0”, л, representa la varianza del valor ajus- 
tado ӯ. Los valores h,, son los elementos de la diagonal de la matriz “SOMBRERO” 


H=X(X'X)'X' 


que desempeña un papel importante en cualquier estudio de residuales y en otros aspec- 
tos modernos del análisis de regresión (véase Myers, 1990, citado en la bibliografía). El 
término matriz SOMBRERO se deriva del hecho de que H genera las “y sombrero”, o 
los valores ajustados cuando se multiplica por el vector y de respuestas observadas. Es 
decir, ӯ = Xb, por lo tanto, 


Y =X(X'X) 'X' y = Hy, 


donde y es el vector cuyo ¡-ésimo elemento es ў. 

Si se hacen las suposiciones acostumbradas de que los €, son independientes y están 
distribuidos normalmente, con media сего y varianza o°, las propiedades estadísticas de 
los residuales se establecen con facilidad. Entonces, 


Ele) = Е(у – ў) =0 y 02 =(1—hy)o”, 


рага і = 1, 2,..., п. (Рага mayores detalles véase Myers, 1990). Es posible demostrar que 
los valores de la diagonal de la matriz SOMBRERO están acotados de acuerdo соп la 
desigualdad 


<hi < 1. 


зүн 


п 
Además, У h; = К +1, el número de parámetros de la regresión. Como resultado, 


cualquier la de los datos cuyo elemento diagonal SOMBRERO sea grande, es decir, 
esté muy por encima del valor promedio de (k + 1)/n, está en una posición dentro del 
conjunto de datos donde la varianza de ӯ, es relativamente grande y la varianza de un 
residuo es relativamente pequeña. Como resultado, el analista de datos puede tener una 
idea de qué tan grande puede ser un residuo antes de que su desviación de cero se pueda 
atribuir a algo distinto del azar. Muchos de los paquetes comerciales para computadora 
que permiten calcular la regresión producen el conjunto de residuales estudentizados. 


Residuo е; e 
estudentizado ri = — >= !=1L....2 


Aquí, cada residuo se dividió entre una estimación de su desviación estándar 
creando un estadístico tipo t diseñado para dar al analista una cantidad sin escala que 
proporcione información sobre el tamaño del residual. Además, a menudo los paquetes 
de cómputo comunes proporcionan valores de otro conjunto de residuales tipo estuden- 
tizados denominados valores R de Student. 


Residual R de t an _ і = 1,2,...,п, 


Student io saiv- hi 
donde s_, es un estimador de la desviación estándar del error calculado con el i-ésimo 
punto de los datos eliminado. 
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Hay tres tipos de transgresiones de las suposiciones fáciles de detectar mediante 
el uso de los residuales o gráficas de residuales. Aunque las gráficas de los residua- 
les brutos, los е, ayudan a esto, con frecuencia es más informativo graficar los residuales 
estudentizados. Las tres transgresiones son las siguientes: 


1. Presencia de valores extremos 
2. Varianza heterogénea del error 
3. Especificación inadecuada del modelo 


En el caso 1 elegimos definir un valor extremo como un punto de los datos que se 
desvía de la suposición común de que Е(є) = 0 para un valor específico de i. Si hay una 
razón para creer que un punto de un dato específico es un valor extremo que ejerce 
una gran influencia sobre el modelo ajustado, r, о г, esto podría estar informando algo. 
Es de esperarse que los valores R de Student sean más sensibles a los valores extremos 
que los valores г. 

En realidad, en el caso de que (є) = 0, t, es un valor de una variable aleatoria que 
sigue una distribución Т con n — 1 — (k + 1) = n — k — 2 grados de libertad. Por consi- 
guiente, es posible utilizar una prueba ѓ de dos colas para proporcionar información con 
el fin de detectar si el punto ¡-ésimo es o no un valor extremo. 

Aunque el estadístico R de Student г produce una prueba г exacta para detectar un 
valor extremo en una ubicación específica, la distribución £ no se aplicaría para probar 
simultáneamente varios valores extremos en todas las ubicaciones. Como resultado, los 
residuales estudentizados o valores R de Student se deberían usar estrictamente como 
herramientas de diagnóstico sin un mecanismo de prueba de hipótesis formal. La im- 
plicación es que dichos estadísticos resaltan puntos de los datos en los que el error del 
ajuste es mayor de lo esperado por el azar. Los valores R de Student de gran magnitud 
sugieren la necesidad de “verificar” los datos con todos los recursos disponibles. La 
práctica de eliminar observaciones de conjuntos de datos de la regresión no debería 
llevarse a cabo de forma indiscriminada. (Para más información sobre el uso de los diag- 
nósticos sobre valores extremos véase Myers, 1990, en la bibliografía). 


Ilustración de la detección de valores extremos 


Estudio de caso 12.1: | Método para capturar saltamontes. En un experimento biológico, que fue efectuado 


en el Departamento de Entomología de Virginia Tech, se hicieron n ensayos experimen- 
tales con dos métodos diferentes para capturar saltamontes. Los métodos consistieron en 
la captura por caída de la red y la captura por barrido de la red. El número promedio de 
saltamontes atrapados con cada método se registró en un conjunto de cuadrantes del 
campo en una fecha determinada. También se registró una variable regresora adicional, 
la altura promedio de las plantas en los cuadrantes. Los datos experimentales aparecen 
en la tabla 12.10. 

El objetivo consiste en estimar cuántos saltamontes se capturan empleando sólo el 
método del barrido de la red, que es menos costoso. Hay cierta preocupación por la vali- 
dez del cuarto punto de los datos. La captura observada utilizando el método de caída de 
la red que se reportó parece inusualmente alta, dadas las demás condiciones, de hecho se 
pensó que la cifra podía ser errónea. Ajuste un modelo del tipo 


у = В + Вх + Вох 
рага los 17 puntos de los datos y estudie los residuales para determinar si el punto 4 es 
un valor extremo. 
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Tabla 12.10: Conjunto de datos para el estudio de caso 12.1 


Captura Captura por Altura de 
por caída barrido de las plantas, 
Observación де Ја red, y la red, xı xz (cm) 
1 18.0000 4.15476 52.705 
2 8.8750 2.02381 42.069 
3 2.0000 0.15909 34.766 
4 20.0000 2.32812 27.622 
5 2.3750 0.25521 45.879 
6 2.7500 0.57292 97.472 
7 3.3333 0.70139 102.062 
8 1.0000 0.13542 97.790 
9 1.3333 0.12121 88.265 
10 1.7500 0.10937 58.737 
11 4.1250 0.56250 42.386 
12 12.8750 2.45312 31.274 
13 5.3750 0.45312 31.750 
14 28.0000 6.68750 35.401 
15 4.7500 0.86979 64.516 
16 1.7500 0.14583 25.241 
17 0.1333 0.01562 36.354 


Solución: Un paquete de cómputo generó el modelo de regresión ajustado 


ӯ = 3.6870 + 4.1050x, — 0.0367х2 


junto con los estadísticos R? = 0.9244 y 5° = 5.580. También se obtuvieron los residuales 
y otra información de diagnóstico que fueron registrados en la tabla 12.11. 

Como se esperaba, el residual en la cuarta ubicación parece inusualmente grande, a 
saber, 7.769. La cuestión fundamental aquí es si este residual es más grande de lo que se 
esperaría debido al azar. El error estándar del residual para el punto 4 es 2.209. El valor 
R de Student г, que se obtuvo es 9.9315. Al considerarlo como el valor de una variable 
aleatoria que tiene una distribución t con 13 grados de libertad, se concluiría sin duda 
que el residuo de la cuarta observación se estima algo mayor que 0, y que la medición 
del presunto error es apoyada por el estudio de los residuales. Observe que ningún otro 
valor de los residuales proporciona un valor R de Student que sea motivo de alarma. I 


Gráfica de los residuales para el estudio de caso 12.1 


En el capítulo 11 estudiamos con cierto detalle la utilidad de graficar los residuos en el 
análisis de regresión. Es frecuente que con base en dichas gráficas se detecte la violación 
de las suposiciones del modelo. En la regresión múltiple en ocasiones es útil graficar la 
probabilidad normal de los residuales о los residuales en comparación con $. Sin em- 
bargo, a menudo es preferible graficar los residuales estudentizados. 

Recuerde que la preferencia por los residuales estudentizados sobre los residuales 
ordinarios para propósitos de graficación se debe a que, como la varianza de ¡-ésimo 
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Tabla 12.11: Información sobre los residuales para 
el conjunto de datos del estudio de caso 12.1 


Obs. у; Îi А ай һа 5 ү1— hä Fi ti 
1 18.000 18.809 —0.809 0.2291 2.074 —0.390 —0.3780 
2 8.875 10.452 —1.577 0.0766 2.270 —0.695 —0.6812 
3 2.000 3.065  —1.065 0.1364 2.195 —0.485  —0.4715 
4 20.000 12.231 7.769 0.1256 2.209 3.517 9.9315 
5 2.375 3.052 —0.677 0.0931 2.250 —0.301 —0.2909 
6 2.750 2.464 0.286 0.2276 2.076 0.138 0.1329 
7 3.333 2.823 0.510 0.2669 2.023 0.252 0.2437 
8 1.000 0.656 0.344 0.2318 2.071 0.166 0.1601 
9 1:333 0.947 0.386 0.1691 2.153 0.179 0.1729 
10 1.750 1.982 —0.232 0.0852 2.260 —0.103  —0.0989 
11 4.125 4.442 —0.317 0.0884 2.255 —0.140  —0.1353 
12 12.875 12.610 0.265 0.1152 2.222 0.119 0.1149 
13 5.375 4.383 0.992 0.1339 2.199 0.451 0.4382 
14 28.000 29.841 —1.841 0.6233 1.450 —1.270 —1.3005 
15 4.750 4.891  —0.141 0.0699 2.278 —0.062  —0.0598 
16 1.750 3.360 —1.610 0.1891 2.127 —0.757  —0.7447 
17 0.133 2.418 —2.285 0.1386 2.193 —1.042 —1.0454 


residuo depende del ¡-ésimo elemento en la diagonal SOMBRERO, las varianzas de 
los residuos diferirán si hay dispersión en las diagonales SOMBRERO. Así, es probable 
que la apariencia de una gráfica de residuales sugiera heterogeneidad debido a que los 
propios residuales no se comportan, en general, de manera ideal. El propósito de utilizar 
residuales estudentizados es proporcionar un tipo de estandarización. Es evidente que si 
se conociera g, en condiciones ideales, es decir, en las que el modelo fuera correcto y la 
varianza homogénea, se tendría 


е; ё; 
Е | —=R=|=0 у -——|=1 
(==) y (7) 


De manera que los residuales estudentizados producen un conjunto de estadísticos que 
en condiciones ideales se comportan en forma estándar. La figura 12.5 presenta una grá- 
fica con los valores R de Student para los datos de los saltamontes del estudio de caso 
12.1. Advierta que el valor para la observación 4 se destaca de los demás. La gráfica R 
de Student se generó con el programa SAS. La gráfica presenta los residuales en compa- 
ración con los valores ў. 


Verificación de la normalidad 


El lector debe recordar, de acuerdo con lo que se estudió en el capítulo 11, la importan- 
cia de verificar la normalidad utilizando una gráfica de probabilidad normal. La misma 
recomendación es válida para el caso de la regresión lineal múltiple. Las gráficas de 
probabilidad normal se pueden generar utilizando software estándar para regresión. Sin 
embargo, como ya se indicó, éstas pueden ser más eficaces si se usan residuales estuden- 
tizados o valores R de Student en vez de residuales comunes. 
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Figura 12.5: Valores R de Student graficados en comparación con los valores predichos 
para los datos de los saltamontes del estudio de caso 12.1. 


12.11 Validación cruzada, C,, y otros criterios para la selección 
del modelo 


Para muchos problemas de regresión el experimentador debe elegir entre varios modelos 
alternativos o formas de modelo que se desarrollan a partir del mismo conjunto de datos. 
Con mucha frecuencia se requiere el modelo que predice o estima mejor la respuesta 
media. El experimentador debe tomar en cuenta los tamaños relativos de los valores de s? 
para los posibles modelos y, sin duda, la naturaleza general de los intervalos de confianza 
sobre la respuesta media. También se debe considerar lo bien que el modelo predice los 
valores de la respuesta que no se hayan utilizado para construir los posibles modelos. 
Los modelos deben estar sujetos a validación cruzada. Entonces, lo que se requiere son 
los errores de la validación cruzada en lugar de los errores del ajuste. Estos errores en la 
predicción son los residuales PRESS. 


о = у=), 1=1,2,...,n, 


donde $, _, es la predicción del ¡-ésimo punto de los datos por medio de un modelo que 
no utiliza el ¡-ésimo punto en el cálculo de los coeficientes. Estos residuales PRESS se 
calculan mediante la fórmula 


i= РУЛИ А 
(La derivación se encuentra en Myers, 1990). 


Uso del estadístico PRESS 


La motivación para utilizar PRESS y la utilidad de los residuales PRESS es muy fácil 
de entender. El propósito de extraer o separar puntos de datos, uno a la vez, consiste en 
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permitir el empleo de metodologías separadas para ajustar y evaluar un modelo específico. 

Para evaluar un modelo la “— indica que el residual PRESS proporciona un error de 

predicción donde la observación que se predice es independiente del ajuste del modelo. 
Los criterios que utilizan los residuales PRESS son dados por 


Уа y PRESS= Y 82. 
i=l 


i=l 


(El término PRESS es un acrónimo que se forma con las iniciales de los términos de la 

frase en inglés prediction sum of squares, que se traduce como suma de cuadrados de 

predicción). Se sugiere que se utilicen ambos criterios. Es posible que PRESS sea domi- 
n 

nado por uno o algunos residuales PRESS grandes. Es evidente que el criterio sobre DA 
=1 


1 
es menos sensible a un número pequeño de valores grandes. 


Además del estadístico PRESS en sí, el analista puede simplemente calcular un 
estadístico similar a R? que refleje el desempeño de la predicción. Con frecuencia a este 


estadístico se le denomina Rf, y se calcula como sigue: 


R? de predicción 


Dado un modelo ajustado con valor específico para PRESS, Ко „ es dado por 
PRESS 
R T =l n 
DP 
i=l 
Observe que Rf, es tan sólo el estadístico común R? donde la SCE fue reemplazada por 
el estadístico PRESS. 


En el siguiente estudio de caso se proporciona un ejemplo en el que se ajustan mu- 
chos posibles modelos a un conjunto de datos y se elige el mejor de ellos. No se emplean 
los procedimientos secuenciales descritos en la sección 12.9. En vez de eso se ilustra el 
papel que desempeñan los residuales PRESS y otros valores estadísticos cuando se trata 
de seleccionar la mejor ecuación de regresión. 


Estudio de caso 12.2: | Patada de fútbol. La fuerza de las piernas es un requisito necesario para que un pateador 


tenga éxito en el fútbol americano. Una medida de la calidad de una buena patada es el 
“tiempo de vuelo” del balón, es decir, el tiempo que el balón se mantiene en el aire antes 
de ser atrapado por el regresador de patadas. Para determinar cuáles factores de la fuerza 
de las piernas influyen en el tiempo de vuelo y desarrollar un modelo empírico para prede- 
cir esta respuesta, el Departamento de Salud, Educación Física y Recreación de Virginia 
Tech llevó a cabo un estudio sobre La relación entre variables seleccionadas de desem- 
peño físico y la capacidad de despejes en el fútbol. Se eligieron 13 pateadores para el 
experimento y cada uno pateó 10 veces el balón. En la tabla 12.12 aparece el registro del 
tiempo de vuelo promedio, junto con las medidas de fuerza usadas en el análisis. 
Cada variable regresora se define como sigue: 


1. FPD, fuerza de la pierna derecha (libras) 
2. FPI, fuerza de la pierna izquierda (libras) 
3. FTD, flexibilidad muscular del tendón derecho (grados) 
4. ЕТТ, flexibilidad muscular del tendón izquierdo (grados) 
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5. Potencia, fuerza general de las piernas (pie-libras) 
Determine el modelo más adecuado para predecir el tiempo de vuelo. 
Tabla 12.12: Datos para el estudio de caso 12.2. 


Tiempo de FPD, FPI, FTD, FTI, Potencia, 


Pateador vuelo, y (seg) xı х2 Хз Xa х5 
1 4.75 170 170 106 106 240.57 
2 4.07 140 130 92 93 195.49 
3 4.04 180 170 93 78 152.99 
4 4.18 160 160 103 93 197.09 
5 4.35 170 150 104 93 266.56 
6 4.16 150 150 101 87 260.56 
7 4.43 170 180 108 106 219.25 
8 3.20 110 110 86 92 132.68 
9 3.02 120 110 90 86 130.24 
10 3.64 130 120 85 80 205.88 
11 3.68 120 140 89 83 153.92 
12 3.60 140 130 92 94 154.64 
13 3.85 160 150 95 95 240.57 


Solución: Al buscar el mejor modelo posible para predecir el tiempo de vuelo se obtuvo la infor- 
mación de la tabla 12.13 utilizando un paquete de cómputo para regresión. Los modelos 
están clasificados en orden ascendente con respecto a los valores del estadístico PRESS. 
Esta presentación brinda información suficiente acerca de todos los modelos posibles 
con el fin de permitir que el usuario elimine algunos de ellos. Al parecer, el mejor mode- 
lo para predecir el tiempo de vuelo para los pateadores es el que contiene a x, y x, (FPI 
y potencia), denotadas por x,x,. Asimismo, observe que todos los modelos con valores 


bajos de PRESS, de s?, de Уб, 


, y con valores altos de R?, contienen esas dos variables. 


i=l 
Para obtener información de los residuales de la regresión ajustada 
Îi = bo + охо; + d5Xsi, 


se generaron los residuales y los residuales PRESS. El modelo de predicción real (véase 
el ejercicio 12.47 de la página 494) es dado por 


Y = 1.10765 + 0.01370x2 + 0.00429x5. 


En la tabla 12.14 se listan los residuales, los valores de la diagonal testada y los valores 
PRESS. 

Observe el ajuste relativamente bueno de los modelos de regresión con dos variables 
para los datos. Los residuales PRESS reflejan la capacidad de la ecuación de regre- 
sión para predecir el tiempo de vuelo si se hicieran predicciones independientes. Por 
ejemplo, para el pateador número 4 el tiempo de vuelo de 4.180 tendría un error de pre- 
dicción de 0.039 si se construyera el modelo usando a los 12 pateadores restantes. Para 
este modelo el error promedio de la predicción, o error de validación cruzada, es 


1 n 
13 5 |б;| = 0.1489 segundos, 
¡=1 
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Tabla 12.13: Comparación de diferentes modelos de regresión 


Modelo s? © 18; | PRESS R? 

Х2Х5 0.036907 1.93583 0.54683 0.871300 
X1X2X5 0.041001 2.06489 0.58998 0.871321 
X2X4X5 0.037708 2.18797 0.59915 0.881658 
X2X3X5 0.039636 2.09553 0.66182 0.875606 
X1X2X4X5 0.042265 2.42194 0.67840 0.882093 
X1X2X3X5 0.044578 2.26283 0.70958 0.875642 
X2X3X4X5 0.042421 2.55789 0.86236 0.881658 
X1X3X5 0.053664 2.65276 0.87325 0.831580 
X1X4X5 0.056279 2.75390 0.89551 0.823375 
X1X5 0.059621 2.99434 0.97483 0.792094 
X2X3 0.056153 2.95310 0.98815 0.804187 
X1X3 0.059400 3.01436 0.99697 0.792864 
X1X2X3X4X5 0.048302 2.87302 1.00920 0.882096 
X2 0.066894 3.22319 1.04564 0.743404 
X3X5 0.065678 3.09474 1.05708 0.770971 
X1X2 0.068402 3.09047 1.09726 0.761474 
X3 0.074518 3.06754 1.13555 0.714161 
X1X3X4 0.065414 3.36304 1.15043 0.794705 
X2X3X4 0.062082 3.32392 1.17491 0.805163 
X2X4 0.063744 3.59101 1.18531 0.777716 
Х1Х2Х3 0.059670 3.41287 1.26558 0.812730 
X3X4 0.080605 3.28004 1.28314 0.718921 
X1X4 0.069965 3.64415 1.30194 0.756023 
Xa 0.080208 3.31562 1.30275 0.692334 
X1X3X4X5 0.059169 3.37362 1.36867 0.834936 
X1X2X4 0.064143 3.89402 1.39834 0.798692 
X3X4X5 0.072505 3.49695 1.42036 0.772450 
X1X2X3X4 0.066088 3.95854 1.52344 0.815633 
х5 0.111779 4.17839 1.72511 0.571234 
Х4Х5 0.105648 4.12729 1.87734 0.631593 
X4 0.186708 4.88870 2.82207 0.283819 


que es pequeño comparado con el tiempo de vuelo promedio para los 13 pateadores. I 

En la sección 12.9 indicamos que a menudo es aconsejable utilizar todos los sub- 
conjuntos posibles de regresión cuando se busca el mejor modelo. La mayoría de los 
programas comerciales de cómputo para estadística contienen una rutina de todas las 
regresiones posibles. Tales algoritmos calculan diversos criterios para todos los sub- 
conjuntos de términos del modelo. Es evidente que criterios como R?, s? y PRESS son 
razonables para elegir entre subconjuntos de candidatos. Otro estadístico muy popular 
y útil, en particular para las ciencias físicas e ingeniería, es el estadístico С,, que se des- 
cribe a continuación. 
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Tabla 12.14: Residuales PRESS 


Pateador y; ӯ; ei =у: –ӱ; hi Ôi 
1 4.750 4.470 0.280 0.198 0.349 
2 4.070 3.728 0.342 0.118 0.388 
3 4.040 4.094 —0.054 0.444 —0.097 
4 4.180 4.146 0.034 0.132 0.039 
5 4.350 4.307 0.043 0.286 0.060 
6 4.160 4.281 —0.121 0.250 —0.161 
7 4.430 4.515 —0.085 0.298 —0.121 
8 3.200 3.184 0.016 0.294 0.023 
9 3.020 3.174 —0.154 0.301 —0.220 
10 3.640 3.636 0.004 0.231 0.005 
11 3.680 3.687 —0.007 0.152 —0.008 
12 3.600 3.553 0.047 0.142 0.055 
13 3.850 4.196 —0.346 0.154 —0.409 


El estadístico С, 


Muy a menudo la selección del modelo más adecuado implica tomar en cuenta muchas 
cosas. Evidentemente el número de términos del modelo es importante; el tema de la 
parsimonia no debe ignorarse. Por otro lado, el analista no debe sentirse satisfecho con 
un modelo demasiado simple hasta el punto de una simplificación excesiva. En este sen- 
tido, un estadístico único que implica un compromiso aceptable es C,. (Véase Mallows, 
1973, en la bibliografía). 

El estadístico C, apela de forma muy adecuada al sentido común y se desarrolla 
tomando en cuenta el equilibrio apropiado entre el sesgo excesivo en que se incurre 
cuando se subajusta, es decir, cuando se eligen muy pocos términos para el modelo; y 
la varianza excesiva de la predicción que se genera cuando se sobreajusta, o sea cuando 
hay redundancias en el modelo. El estadístico C, es una función simple del número total 
de parámetros en el posible modelo y la media cuadrada del error s?. 

Aquí no presentaremos el desarrollo completo del estadístico C,. (Para mayores de- 
talles se recomienda consultar a Myers, 1990, listado en la bibliografía). El C, para un 
subconjunto particular de modelos es un estimado de lo siguiente: 


1 n л 1 п ` 
Го = 55 У | Маг(ў) + z У `(5евго ў;)”. 
ї=1 ї=1 


Se descubre que, bajo las suposiciones estándar de los mínimos cuadrados que se indica- 
ron con anterioridad en este capítulo, y asumiendo que el modelo “verdadero” es aquel 
que contiene todas las posibles variables, 


1 п 
z Уу, Маг(ў;) = p (número de parámetros en el posible modelo) 
i=l 
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(véase el ejercicio de repaso 12.63) y un estimado no sesgado de 


IS 22 8" 0 18 р) 
po 2 (безо) es dado рог аг So Y s A 
ise 
En las ecuaciones anteriores s? es el cuadrado medio del error para el posible modelo 
у 0? es la varianza del error de la población. Así, si asumimos que se dispone de algún 
estimado 6? para о?, entonces C, es dado рог la siguiente ecuación: 


Estadístico С, 


(s? — ôn — p) 
Cp =p+ 682° 


donde р es el número de parámetros en el modelo, s? es el cuadrado medio del error para 
el modelo candidato y 6? es un estimador de o°. 


Es evidente que el científico debería adoptar modelos con valores pequeños de С,. 
El lector observará que, a diferencia del estadístico PRESS, С, carece de una escala. 
Además, se puede obtener cierta información acerca de qué tan adecuado es un posible 
modelo observando su valor de C,. Por ejemplo, C, > р indica que un modelo está ses- 
gado debido a que está subajustado, mientras que C, ~ р indica un modelo razonable. 

Con frecuencia hay confusión respecto a la procedencia de 6? en la fórmula para С,. 
Es evidente que el científico o ingeniero no tienen acceso а la cantidad о? de la pobla- 
ción. En aplicaciones donde se dispone de corridas repetidas, digamos en situaciones de 
diseño experimental, se dispone de un estimado de т? independiente del modelo (véase 
los capítulos 11 y 15). Sin embargo, la mayoría de paquetes de cómputo utilizan 6? 
como el cuadrado medio del error del modelo más completo. Evidentemente, si éste no 
es un buen estimado, la parte de sesgo del estadístico C, puede ser negativa. Por consi- 
guiente, C, puede ser menor que p. 


Ejemplo 12.12: | Considere el conjunto de datos de la tabla 12.15, los cuales reflejan el interés de un fa- 


bricante de grava asfáltica en la relación que existe entre las ventas durante un año espe- 
cífico y los factores que influyen en ellas. (Los datos fueron tomados de Kutner et al., 
2004, véase la bibliografía). 

En los subconjuntos de modelos posibles, hay tres que revisten interés especial. 
Estos tres son los de x,X,, X,X,X, Y X,X,X,x,. A continuación se presenta la información per- 
tinente para comparar los tres modelos. Para ayudar a la toma de decisiones incluimos 
los estadísticos PRESS de los tres modelos. 


Modelo R? Кы s? PRESS Cp 
X2X3 0.9940 0.9913 44.5552 782.1896 11.4013 


X1X2X3 0.9970 0.9928 24.7956 643.3578 3.4075 
хүхохзха 0.9971 0.9917 26.2073 741.7557 5.0 


A partir de la información де la tabla parece claro que el modelo x,x,x, es mejor 
que los otros dos. Observe que para el modelo completo C, = 5.0. Esto ocurre porque la 
parte de sesgo es igual a cero y 6? = 26.2073 es el cuadrado medio del error del modelo 
completo. И | 

La figura 12.6 es una salida de resultados de la función PROC REG del SAS, la cual 
muestra información sobre todas las regresiones posibles. A partir de ella es posible 
hacer comparaciones de otros modelos con (x,, x,, x,). Observe que (x,, x,, x,) parece 
muy bueno en comparación con todos los demás modelos, 

Como verificación final del modelo (х, х,, x,), la figura 12.7 presenta una gráfica de 
probabilidad normal de los residuales del modelo. 
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Tabla 12.15: Datos para el ejemplo 12.12 
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Cuentas Cuentas Marcas en Potencial, Ventas, 
Distrito promocionales, х activas, хә competencia, хз x4 y (miles) 
1 2.9 31 10 8 $ 79.3 
2 2.5 35 8 6 200.1 
3 8.0 67 12 9 163.2 
4 3.0 50 7 16 200.1 
5 3.0 38 8 15 146.0 
6 2.9 71 12 17 177.7 
7 8.0 30 12 8 30.9 
8 9.0 56 5 10 291.9 
9 4.0 42 8 4 160.0 
10 6.5 73 5 16 339.4 
11 5.5 60 11 7 159.6 
12 5.0 44 12 12 86.3 
13 6.0 50 6 6 237.5 
14 9:0 39 10 4 107.2 
15 3.5 55 10 4 155.0 
Dependent Variable: sales 
Number in Adjusted 
Model C(p)  R-Square R-Square MSE Variables іп Model 
3 3.4075 0.9970 0.9961 24.79560 х1 х2 x3 
4 5.0000 0.9971 0.9959 26.20728 xl х2 x3 х4 
2 11.4013 0.9940 0.9930 44.55518 x2 x3 
3 13.3770 0.9940 0.9924 48.54787 х2 x3 x4 
3 1053.643 0.6896 0.6049 2526.96144 x1 x3 x4 
2 1082.670 0.6805 0.6273 2384.14286 x3 x4 
2. 1215.316 0.6417 0.5820 2673.83349 x1 x3 
1 1228.460 0.6373 0.6094 2498.68333 x3 
3 1653.770 0.5140 0.3814 3956.75275 х1 х2 x4 
2 1668.699 0.5090 0.4272 3663.99357 x1 x2 
2 1685.024 0.5042 0.4216 3699.64814 х2 x4 
1 1693.971 0.5010 0.4626 3437.12846 х2 
2 3014.641 0.1151 -.0324 6603.45109 х1 х4 
1 3088.650 0.0928 0.0231 6248.72283 x4 
1 3364.884 0.0120 -.0640 6805.59568 х1 


Figura 12.6: Salida de resultados del SAS de todos los subconjuntos posibles sobre 


los datos de las ventas para el ejemplo 12.12. 
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Figura 12.7: Gráfica de la probabilidad normal de los residuales, utilizando el modelo 
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Ejercicios 


12.47 Considere los datos sobre el “tiempo de vuelo” 
de los pateadores que se presentaron en el estudio de 
caso 12.2 y, utilizando sólo las variables x, y x,. 
a) Verifique la ecuación de regresión que se presenta 
en la página 489. 
b) Prediga el tiempo de vuelo para un pateador con 
FPI = 180 libras y potencia = 260 pie-libras. 
c) Construya un intervalo de confianza de 95% para 
el tiempo de vuelo promedio de un pateador con 
FPI = 180 libras y potencia = 260 pies-libras. 
12.48 Рага los datos del ejercicio 12.15 de la página 
452 utilice las técnicas de 
a) selección hacia delante a un nivel de significancia 
de 0.05 para elegir un modelo de regresión lineal; 
b) eliminación hacia atrás a un nivel de significancia 
de 0.05 para seleccionar un modelo de regresión 
lineal; 
c) regresión por etapas a un nivel de significancia de 
0.05 para escoger un modelo de regresión lineal. 
12.49 Emplee las técnicas de eliminación hacia atrás 
con Y = 0.05 para elegir una ecuación de predicción 
para los datos de la tabla 12.8. 
12.50 Para los datos de los pateadores del estudio de 
caso 12.2 también se registró una respuesta adicional, 
la “distancia de la patada”. Los siguientes son los va- 
lores de distancia promedio para cada uno de los 13 
pateadores: 
a) Utilice los datos de distancia en lugar de los de 
tiempo de vuelo para estimar un modelo de regre- 
sión lineal múltiple del tipo 


b) 


c) 


d) 


Hy [х1, х2, х3, X4, X5 


= 8 + Bi xı + хә + B3 X3 + Baxa + O5x5 


que permita predecir la distancia de la patada. 

Utilice la regresión por etapas a un nivel de signi- 

ficancia de 0.10 para seleccionar una combinación 

de variables. Ж 

Genere valores рага s?, R?, PRESS у Уб, рага el 
i=l 


conjunto completo de 31 modelos. Utilice esta in- 
formación para determinar la mejor combinación 
de variables para predecir la distancia de la patada. 
Para el modelo final que seleccione, grafique los 
residuales estandarizados en comparación con Y 
y elabore una gráfica de probabilidad normal de 
los residuales ordinarios. Haga comentarios al res- 
pecto. 


Pateador Distancia, y (pies) 


1 162.50 

144.00 

3 147.50 

4 163.50 

5 192.00 

6 171.75 

7 162.00 

8 104.93 

9 105.67 

10 117.59 
11 140.25 
12 150.17 
13 165.16 


Ejercicios 


12.51 El siguiente es un conjunto de datos para у, la 
cantidad de dinero (en miles de dólares) aportado a la 
asociación de exalumnos del Virginia Tech por la ge- 
neración de 1960; y para x, el número de años que han 
transcurrido desde la graduación: 


y x y x 
812.52 1 2755.00 11 
822.50 2 4390.50 12 

1211.50 3 5581.50 13 
1348.00 4 5548.00 14 
1301.00 8 6086.00 15 
2567.50 9 5764.00 16 
2526.50 10 8903.00 17 


a) Ajuste un modelo de regresión del tipo 
Hy ix = Во + Bix. 
b) Ajuste un modelo cuadrático del tipo 
Hr ix = Во + Bix + Bux?. 
c) Determine cuál de los modelos de los incisos a) 
o b) es preferible. Utilice s?, R? y los residuales 
PRESS para sustentar su decisión. 


12.52 Para el modelo del ejercicio 12.50a) pruebe la 
hipótesis Ho: @ = 0, 

Н: В, +0. 
Utilice un valor Р para su conclusión. 


12.53 Para el modelo cuadrático del ejercicio 12.51b) 
proporcione estimados de las varianzas y las covarian- 
zas de los estimados de 8, y B,,. 


12.54 Un cliente del Departamento de Ingeniería 
Mecánica se acercó al Centro de Consulta de Virginia 
Tech para que lo ayudaran a analizar un experimento 
sobre motores con turbina de gas. Se midieron varias 
salidas del voltaje de los motores con distintas combi- 
naciones de velocidad de las aspas y de la extensión de 
los sensores. Los datos son los siguientes: 


y Velocidad, x, Extensión, 
(voltios) (pulg/seg) x, (pulg) 
1.95 6336 0.000 
2.50 7099 0.000 
2.93 8026 0.000 
1.69 6230 0.000 
1:23 5369 0.000 
3.13 8343 0.000 
1.55 6522 0.006 
1.94 7310 0.006 
2.18 7974 0.006 
2.70 8501 0.006 
1.32 6646 0.012 
1.60 7384 0.012 
1.89 8000 0.012 
2.15 8545 0.012 
1.09 6755 0.018 
1.26 7362 0.018 
1.57 7934 0.018 
1.92 8554 0.018 


a) Ajuste una regresión lineal múltiple a los datos. 
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b) Calcule las pruebas т sobre los coeficientes. Pro- 
porcione valores P. 

c) Haga comentarios sobre la calidad del modelo 
ajustado. 


12.55 La blancura del rayón es un factor importante 
para los científicos que estudian la calidad de las telas. La 
blancura se ve afectada por la calidad de la pulpa y otras 
variables de procesamiento. Algunas de las variables 
son la temperatura del baño con ácido, °С (х,); 1а соп- 
centración del ácido en cascada, % (x,); la temperatura 
del agua, °С (x,); la concentración del sulfuro, % (х); la 
cantidad del blanqueador de cloro, Ib/min (x,) y la tem- 
peratura de terminado de la tela, *C (x,). A continuación 
se proporciona un conjunto de datos de especímenes de 
rayón. La respuesta, y, es la medida de la blancura. 


y ХІ X2 X3 X4 X5 X6 
88.7 43 0211 85 0.243 0.606 48 
89.3 42 0604 89 0.237 0.600 55 
75.5 47 0450 87 0198 0.527 6l 
92.1 46 0641 90 0.194 0.500 65 
83.4 52 0370 93 0.198 0.485 54 
448 50 0526 85 0.221 0.533 60 
50.9 43 0.486 83 0.203 0.510 57 
78.0 49 0504 93 0.279 0.489 49 
86.8 51 0609 90 0.220 0.462 64 
47.3 51 0702 86 0198 0.478 63 
53.7 48 0397 92 0.231 0.411 61 
92.0 46 0.488 88 0.211 0.387 88 
87.9 43 0525 85 0.199 0.437 63 


90.3 45 0486 84 0.189 0.499 58 
94.2 53 0527 87 0.245 0.530 65 
89.5 47 0601 95 0.208 0.500 67 

a) Utilice los criterios СМЕ, c, y PRESS para obte- 
ner el “mejor” modelo de todos los subconjuntos 
de los modelos. 

b) Grafique los residuales estandarizados en compa- 
ración con Y y dibuje una gráfica de probabilidad 
normal de los residuales para el “mejor” modelo. 
Comente sus resultados. 


12.56 En un esfuerzo para modelar las remuneracio- 
nes de los ejecutivos en el año 1979 se seleccionaron 
33 empresas y se recabaron datos acerca de las remu- 
neraciones, las ventas, las utilidades y el empleo. Se 
reunieron los siguientes datos para el año 1979. 


Remune- 
raciones, Ventas, ху, Utilidades, х Empleo, 
Empresa у (miles) (millones) (millones) хз 
1 $450 $4600.6 $128.1 48,000 
2 387 9255.4 783.9 55,900 
3 368 1526.2 136.0 13,783 
4 217 1683.2 179.0 27,765 
5 676 2752.8 231.5 34,000 
6 454 2205.8 329.5 26,500 
7 507 2384.6 381.8 30,800 
8 496 2746.0 237.9 41,000 
9 487 1434.0 222.3 25,900 


(cont. ) 
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Remune- 
raciones, Ventas, x,, Utilidades, x, Empleo, 
Empresa y (miles) (millones) (millones) х; 
10 $383 $470.6 $63.7 860 
11 311 1508.0 149.5 21,075 
12 271 464.4 30.0 6874 
13 524 9329.3 577.3 39,000 
14 498 2377.5 250.7 34,300 
15 343 1174.3 82.6 19,405 
16 354 409.3 61.5 3586 
17 324 724.7 90.8 3905 
18 225 578.9 63.3 4139 
19 254 966.8 42.8 6255 
20 208 591.0 48.5 10,605 
21 518 4933.1 310.6 65,392 
22 406 7613.2 491.6 89,400 
23 332 3457.4 228.0 55,200 
24 340 545.3 54.6 7800 
29 698 22,862.8 3011.3 337,119 
26 306 2361.0 203.0 52,000 
27 613 2614.1 201.0 50,500 
28 302 1013.2 121.3 18,625 
29 540 4560.3 194.6 97,937 
30 293 855.7 63.4 12,300 
31 528 4211.6 352.1 71,800 
32 456 5440.4 655.2 87,700 
33 417 1229.9 97.5 14,600 
Considere el modelo 
yi = В + 8. ln xı; +82 In x2; 
+ B3lnx3; + є, E= Libris ЭЗ. 


a) Ajuste la regresión con el modelo anterior. 
b) ¿Un modelo con un subconjunto de variables es 
preferible al modelo completo? 


12.57 La resistencia a la tracción de una unión de 
alambre es una característica importante. La siguiente 
tabla brinda información sobre la resistencia a la trac- 
ción, y, la altura del molde, x,, la altura del perno, x,, 
la altura del lazo, x,, la longitud del alambre, x,, el 
ancho de la unión sobre el molde, x, y el ancho del 
molde sobre el perno, x,. (Datos tomados de Myers, 
Montgomery y Anderson-Cook, 2009). 

a) Ajuste un modelo de regresión usando todas las 
variables independientes. 

b) Utilice la regresión por etapas a un nivel de signifi- 
cancia de entrada de 0.25 y un nivel de significan- 
cia de eliminación de 0.05. Proporcione el modelo 
final. 

c) Utilice todos los modelos de regresión posibles y 
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calcule R?, C,, 5” y R? ajustada para todos los mo- 
delos. 

d) Proporcione el modelo final. 

e) Para el modelo del inciso d) grafique los residuos 
estudentizados (o la R de Student) y haga comen- 
tarios al respecto. 


y Х| X2 X3 X4 х5 X6 
80 52 196 296 949 21 23 
83 52 198 324 897 21 1.8 
85 58 196 310 962 20 20 
88 64 194 324 956 22 2.1 
90 58 186 286 865 20 18 
93 52 188 306 845 21 21 
93 56 204 324 888 22 19 
95 60 190 326 857 21 19 
98 52 208 322 936 23 21 
10.0 5.8 199 318 860 21 18 
103 64 18.0 326 871 20 1.6 
105 60 206 334 931 21 21 
108 62 202 318 834 22 21 
110 62 202 324 945 21 19 
113 62 192 314 834 19 18 
115 56 170 332 852 21 21 
118 60 198 354 841 20 18 
123 58 188 340 869 21 18 
125 56 186 342 830 19 2.0 
12.58 Рага el ejercicio 12.57 pruebe Н: 8, = 8, = 0 


Proporcione valores Р y comente al respecto. 


12.59 En el ejercicio 12.28 de la página 462 se tienen 
los siguientes datos sobre el desgaste de un cojinete: 


xi (viscosidad 


y (desgaste) del aceite) хә (carga) 
193 1.6 851 
230 15.5 816 
172 22.0 1058 
91 43.0 1201 
113 33.0 1357 
125 40.0 1115 


a) Puede considerar el siguiente modelo para descri- 
bir los datos: 
yi = В + Вх: + х2: + бох Хә + éi, 
para i = 1, 2,..., 6. El término хх, es una “interac- 
ción”. Ajuste este modelo y estime los parámetros. 
b) Utilice los modelos (21), (х, х,), (х,), E, Ху» X,X,) 
y calcule PRESS, С,, y s? para determinar el “me- 
jor” modelo. 


12.12 Modelos especiales no lineales para condiciones no ideales 


En gran parte del material anterior de este capítulo y en el del capítulo 11 nos hemos 
beneficiado mucho de la suposición de que los errores del modelo, los є, SON normales, 
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con media igual a cero y varianza constante o°. Sin embargo, en la vida real hay muchas 
situaciones en las cuales es evidente que la respuesta no es normal. Por ejemplo, existe 
una gran cantidad de aplicaciones en las que la respuesta es binaria (0 o 1), por lo que 
su naturaleza es de Bernoulli. En las ciencias sociales un problema podría ser el de de- 
sarrollar un modelo que prediga si un individuo representa riesgos para un crédito (0 o 
1), en función de ciertos regresores socioeconómicos, como sus ingresos, edad, género 
y nivel de escolaridad. En una prueba biomédica para un fármaco a menudo se observa 
si el paciente responde o no de manera favorable a éste, en tanto que los regresores po- 
drían incluir la dosis y factores biológicos como la edad, el peso y la presión sanguínea. 
Nuevamente la respuesta es de naturaleza binaria. También abundan las aplicaciones en 
las áreas de manufactura en que ciertos factores controlables influyen en el hecho de que 
un artículo fabricado esté o no defectuoso. 

Un segundo tipo de aplicación que no es normal y del que haremos una mención 
breve tiene que ver con el conteo de datos. Aquí a menudo es conveniente suponer 
una respuesta de Poisson. En aplicaciones biomédicas la respuesta que se modela en 
comparación con las dosis de medicamentos podría ser el número de colonias de células 
cancerosas. En la industria textil una respuesta razonable que se modela en comparación 
con ciertas variables de los procesos es el número de imperfecciones por yarda de tela. 


Varianza no homogénea 


El lector debería notar la comparación de la situación ideal, es decir, la respuesta nor- 
mal, con la de la respuesta de Bernoulli (o binomial) o la de Poisson. Nos hemos acos- 
tumbrado al hecho de que el caso normal es muy especial debido a que la varianza es 
independiente de la media. Resulta claro que éste no es el caso para la respuesta de 
Bernoulli ni la de Poisson. Por ejemplo, si la respuesta es 0 o 1, lo cual sugiere una res- 
puesta de Bernoulli, entonces el modelo adopta la forma 


pP =f (х, б), 


donde p es la probabilidad de un éxito (por ejemplo, la respuesta = 1). El parámetro 
p desempeña el papel de u, еп el caso normal. Sin embargo, la varianza de Bernoulli 
es p(l — p) que, desde luego, también es una función del regresor x. Como resultado, 
la varianza no es constante. Esto descarta el uso de los mínimos cuadrados estándar que 
hemos utilizado en nuestro trabajo de regresión lineal hasta este momento. Lo mismo se 
aplica para el caso de Poisson, ya que el modelo adopta la forma 


Х =/(х, б), 


соп Var(y) = и = А, que varía con х. 


Respuesta binaria (regresión logística) 


El enfoque más popular para modelar respuestas binarias es la técnica llamada regresión 
logística, la cual se emplea mucho en las ciencias biológicas, en la investigación biomé- 
dica y en la ingeniería. De hecho, se observa que incluso en las ciencias sociales abundan 
las respuestas binarias. La distribución básica para la respuesta es la de Bernoulli o la 
binomial. La primera se encuentra en estudios observacionales donde no hay corridas 
repetidas en cada nivel de regresor; mientras que la segunda será el caso en que se uti- 
lice un diseño experimental. Por ejemplo, en un ensayo clínico en el cual se evalúa un 
fármaco nuevo, el objetivo podría ser el de determinar la dosis del medicamento que es 
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eficaz. Así, en el experimento se utilizarán ciertas dosis y para cada una de ellas se em- 
plearán a varios sujetos, un caso al que se le denomina caso agrupado. 


¿Cuál es el modelo para la regresión logística? 


En el caso de respuestas binarias la respuesta media es una probabilidad. En la ilustra- 
ción anterior del ensayo clínico podríamos decir que deseamos estimar la probabili- 
dad de que el paciente responda en forma adecuada al fármaco, P(éxito). Entonces, el 
modelo se escribe en términos de una probabilidad. Dados los regresores x, la función 
logística es dada por 

1 


P=] Herb” 
La porción x’ se llama predictor lineal у, en el caso de un solo regresor x, se puede es- 
cribir х'В = 8, + P,x. Desde luego, no descartamos la inclusión de regresores múltiples 
y de términos polinomiales en el llamado predictor lineal. En el caso agrupado el modelo 
implica el modelado de la media de una binomial en vez de una de Bernoulli, por lo que 
la media es dada por 

п 


ктт 


Características de la función logística 


Una gráfica de la función logística revela mucho sobre sus características y del porqué 
se utiliza para este tipo de problema. En primer lugar, la función es no lineal. Además, 
la gráfica de la figura 12.8 revela la forma de S con la función que tiende a la asíntota en 
p = 1.0. En este caso, 8, > 0. Así, nunca se experimentaría una probabilidad estimada 
mayor que 1.0. 


1.0 


Figura 12.8: La función logística. 


Los coeficientes de regresión en el predictor lineal se estiman con el método de pro- 
babilidad máxima, tal como se describió en el capítulo 9. La solución de las ecuaciones 
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de probabilidad requiere una metodología iterativa que no se describe aquí. Sin embargo, 
presentaremos un ejemplo y analizaremos la salida de resultados por computadora y las 
conclusiones. 


Ejemplo 12.13: (El conjunto de datos de la tabla 12.16 se utilizará con el fin de ilustrar el uso de la regre- 
sión logística para analizar un ensayo biológico cuantal de agente único en un experi- 
mento de toxicidad. Los resultados muestran el efecto de diferentes dosis de nicotina en 
la mosca común de la fruta. 


Tabla 12.16: Conjunto de datos para el ejemplo 12.13 


x n; y 

Concentración Número Número Porcentaje 

(gramos/100 cc) de insectos de muertes de muertes 
0.10 47 8 17.0 
0.15 53 14 26.4 
0.20 55 24 43.6 
0.30 52 32 61.5 
0.50 46 38 82.6 
0.70 54 50 92.6 
0.95 52 50 96.2 


El propósito del experimento era el de obtener un modelo adecuado que relacionara 
la probabilidad de “muerte” con la concentración. Además, el analista buscaba la deno- 
minada dosis eficaz (DE), es decir, la concentración de nicotina que da como resultado 
cierta probabilidad. La DE,, tiene interés particular, ya que es la concentración que pro- 
duce una probabilidad de 0.5 de que el “insecto muera”. 

Este ejemplo es agrupado, por lo que el modelo es dado por 


П; 
EN) = ирга 1 + e (Bo+Brxi)" 
Los estimados de 8, y 8, y sus errores estándar, se calculan usando el método de pro- 
babilidad máxima. Las pruebas de los coeficientes individuales se calculan utilizando el 
estadístico x? en lugar del estadístico т, puesto que no hay una varianza común 0°. 
El estadístico x? se obtiene a partir de (coef /error estándar). 
Por consiguiente, obtenemos la siguiente salida de resultados por computadora de la 
función PROC LOGIST del SAS. 


Análisis de los estimados de los parámetros 


gl Estimado Error estándar Chi cuadrada Valor P 
Bo 1 —1.7361 0.2420 51.4482 < 0.0001 
Bi 1 6.2954 0.7422 71.9399 < 0.0001 


Ambos coeficientes difieren significativamente de cero. Por consiguiente, el modelo 
ajustado que se emplea para predecir la probabilidad de “muerte” es dado por 


р 1 
p= 1 + eE 1.7361 + 6.2954 x) ` 3 
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Estimado de la dosis eficaz 


El estimado de la DE,, para el ejemplo 12.13 se calcula de manera muy sencilla a partir 
de los estimados b, para 8, y b, para 8. A partir de la función logística se observa que 


log (т^) = 8 + х 


Сото resultado, рага р = 0.5 se calcula un estimado de х a partir de 
bo + bix =0. 


Así, DE, es dada por h 
x=- (2) = 0.276 gramos/100 cc. 
1 


Concepto de razón de probabilidad 


Definición 12.1: 


Otra forma de inferencia que se lleva a cabo de manera adecuada usando la regresión 
logística se deriva del uso de la razón de probabilidad, la cual está diseñada para deter- 
minar cómo se incrementa la probabilidad de éxitos, Пе a medida que ocurren ciertos 
cambios en los valores del regresor. Por ejemplo, en el caso del ejemplo 12.13, quizá 
se deseara saber cómo aumentarían las probabilidades si la dosis se incrementara en, 
digamos, 0.2 gramos/100 cc. 


En la regresión logística una razón de probabilidad es la razón de la probabilidad de 
éxito en la condición 2 con respecto a la de la condición 1 en los regresores, es decir, 


[2/01 -pk 
[р/(1 —Р)11 ( 


Esto permite que el analista tenga una idea de la utilidad de cambiar el regresor en cierto 
número de unidades. Ahora, como ( 125) = ebo+B1x рага el ejemplo 12.13 la razón 


que refleja el incremento de las probabilidades de éxito cuando aumenta la dosis de 
nicotina en 0.2 gramos/100 cc es dada por 


¿0-2b1 — (00.2)06.2954) 3,592. 


La implicación de una razón de probabilidad de 3.522 es que la probabilidad de éxito au- 
menta en un factor de 3.522 cuando la dosis de nicotina aumenta en 0.2 gramos/100 cc. 


Ejercicios 

12.60 А partir de un conjunto de datos de respuestas Dosis Número de Número de 
а Іа dosis de estreptomicina un investigador desea desa- (mg/kg) linfoblastos aberraciones 
rrollar una relación entre la proporción de linfoblastos 0 600 15 
muestreados que contienen aberraciones y la dosis del 30 500 96 
medicamento. Se aplicaron cinco niveles de dosis a los 60 600 187 
conejos que se emplearon para el experimento. Los da- 75 300 100 

tos son los siguientes (véase Myers, 1990, listado en la 90 300 145 


bibliografía): 


Ejercicios de repaso 


a) Ajuste una regresión logística al conjunto de da- 
tos, y así estime 6, y 8, en el modelo 
1 
P= 1+ е-(80+681х) ° 


donde n es el número de linfoblastos, х es la dosis 
y p la probabilidad de una aberración. 

b) Muestre los resultados de pruebas x? que revelen 
la significancia de los coeficientes de regresión 6, 
уб. 


c) Estime la DE,, e interprétela. 


12.61 En un experimento para estudiar el efecto de la 
carga, x, en lb/pulgadas?, sobre la probabilidad de falla 
de especímenes de cierto tipo de tela, varios especíme- 
nes se expusieron a cargas de entre 5 lb/pulg? a 90 lb/ 
pulg’. Se observaron los números de “fallas”. Los datos 
son los siguientes: 


Ejercicios de repaso 


12.62 En el Departamento de Pesca y Vida Silvestre 
de Virginia Tech se realizó un experimento para estu- 
diar el efecto de las características de la corriente sobre 
la biomasa de los peces. Las variables regresoras son 
las siguientes: profundidad promedio (de 50 células), 
x; área de la cubierta en la corriente, es decir, riberas 
socavadas, troncos, cantos rodados, etc., x,; porcentaje 
de cubierta de material translúcido (promedio de 12), 
x, y un área > 25 centímetros de profundidad, x,. La 
respuesta es y, la biomasa de los peces. Los datos son 
los siguientes: 


Obs. y ХІ xy Хз X4 
1 100 14.3 15.0 12.2 48.0 
2 388 19.1 29.4 26.0 152.2 
3 755 54.6 58.0 24.2 469.7 
4 1288 28.8 42.6 26.1 485.9 
5 230 16.1 15.9 31.6 87.6 
6 0 10.0 56.4 23.3 6.9 
7 551 28.5 95.1 13.0 192.9 
8 345 13.8 60.6 7:9 105.8 
9 0 10.7 35.2 40.3 0.0 
10 348 25.9 52.0 40.3 116.6 


а) Ajuste una regresión lineal múltiple que incluya 
las cuatro variables regresoras. 

b) Utilice С, R? y 5? para determinar el mejor sub- 
conjunto de variables. Calcule dichos estadísticos 
para todos los subconjuntos posibles. 

c) Compare lo adecuado de los modelos de los inci- 
sos a) y b) para efectos de predecir la biomasa de 
los peces. 


12.63 Demuestre que, en un conjunto de datos de re- 
gresión lineal múltiple, 


5 hii =P. 
i=l 
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Número de Número 

Carga especímenes de fallas 
5 600 13 
35 500 95 
70 600 189 
80 300 95 
90 300 130 

a) Utilice regresión logística para ajustar el modelo 
1 


p= 1 + e-(Bo+Brx)” 


donde p es la probabilidad de falla y x es la carga. 
b) Emplee el concepto de razón de probabilidad para 
determinar el incremento de la probabilidad de fa- 
lla que resulta de aumentar la carga en 20 lb/pulg?. 


12.64 Se efectuó un experimento sencillo para ajus- 
tar una ecuación de regresión múltiple que relaciona al 
producto, y, con la temperatura, x, el tiempo de reac- 
ción, x, y la concentración de uno de los reactivos, x,. 
Se eligieron dos niveles de cada variable y se hicieron 
las siguientes mediciones correspondientes a las varia- 
bles independientes definidas: 


y Х| Хэ X3 
7.6 1 1 1 
9:9 1 —1 —1 
9.2 —1 1 —1 
10.3 —1 —1 1 
11.6 1 1 —1 
11.1 1 —1 1 
10.2 —1 1 1 
14.0 1 1 1 


a) Utilice las variables codificadas y estime la ecua- 
ción de regresión lineal múltiple 


HY lxix2x03 = b +B1x1 + хә + 6x3. 


b) Separe la SCR, es decir, la suma de cuadrados de 
regresión, en tres componentes con un grado 
de libertad, atribuibles а х, x, y x, respectiva- 
mente. Construya una tabla de análisis de varianza 
donde se indiquen pruebas de significancia sobre 
cada variable. Comente los resultados. 


12.65 En un experimento de ingeniería química re- 
lacionado con la transferencia de calor en una capa de 
fluido superficial se recabaron datos sobre las cuatro 
variables regresoras siguientes: la tasa de flujo del gas 
fluido en lb/hr (x,), la tasa de flujo del gas flotante en 
lb/hr (x,), la abertura de la boquilla de entrada del gas 
flotante en milímetros (x,) y la temperatura de entrada 
del gas flotante en °F (x,). Las respuestas medidas son 
la eficacia de la transferencia de calor (y,) y la eficacia 
térmica (y,). Los datos son los siguientes: 
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Obs. yı y2 ХІ X2 X3 X4 ID y ХІ хә Хз X4 X5 X6 

1 41.852 38.75 69.69 170.83 45 219.74 1 44.609 44 89.47 11.37 62 178 182 
2 155.329 51.87 113.46 230.06 25 181.22 2 45.313 40 75.07 10.07 62 185 185 
3 99.628 53.79 113.54 228.19 65 179.06 3 54.297 44 85.84 8.65 45 156 168 
4 49.409 53.84 118.75 117.73 65 281.30 4 59.571 42 68.15 8.17 40 166 172 
5 72.958 49.17 119.72 117.69 25 282.20 5 49.874 38 89.02 9.22 55 178 180 
6 107.702 47.61 168.38 173.46 45 216.14 6 44.811 47 77.45 11.63 58 176 176 
7 97.239 64.19 169.85 169.85 45 223.88 7 45.681 40 75.98 11.95 70 176 180 
8 105.856 52.73 169.85 170.86 45 222.80 8 49.091 43 81.19 10.85 64 162 170 
9 99.348 51.00 170.89 173.92 80 218.84 9 39.442 44 81.42 13.08 63 174 17 
10 111.907 47.37 171.31 173.34 25 218.12 10 60.055 38 81.87 8.63 48 170 186 
11 100.008 43.18 171.43 171.43 45 219.20 11 50.541 44 73.03 10.13 45 168 168 
12 175.380 71.23 171.59 263.49 45 168.62 12 37.388 45 87.66 14.03 56 186 192 
13 117.800 49.30 171.63 171.63 45 217.58 13 44.754 45 66.45 11.12 51 176 17 
14 217.409 50.87 171.93 170.91 10 219.92 14 47.273 47 79.15 10.60 47 162 164 
15 41.725 54.44 173.92 71.73 45 296.60 15 51.855 54 83.12 10.33 50 166 170 
16 151.139 47.93 221.44 217.39 65 189.14 16 49.156 49 8142 8.95 44 180 185 
17 220.630 42.91 222.74 221.73 25 186.08 17 40.836 51 69.63 10.95 57 168 172 
18 131.666 66.60 228.90 114.40 25 285.80 18 46.672 51 77.91 10.00 48 162 168 
19 80.537 64.94 231.19 113.52 65 286.34 19 46.774 48 91.63 10.25 48 162 164 
20 152.966 43.18 236.84 167.77 45 221.72 20 50.388 49 73.37 10.08 76 168 168 
А . 21 39407 57 73.37 1263 58 174 176 
Considere el modelo para predecir la respuesta del 22 46.080 54 79.38 11.17 62 156 165 
coeficiente de transferencia de calor 23 45.441 52 7632 963 48 164 166 
4 4 7 24 54.625 50 70.87 8.92 48 146 155 
ун = б +) Ba + У By xi 25 45.118 51 67.25 11.08 48 172 172 
j=1 i=l 26 39.203 54 91.63 12.88 44 168 172 
; 27 45.790 51 73.71 10.47 59 186 188 
FJ Вихихи te, ї=12,...,20 Sg 50545 57 5908 993 49 148 155 
А 29 48.673 49 76.32 940 56 186 188 
30 47.920 48 61.24 11.50 52 170 176 


a) Calcule PRESS y | y, — 9.4] para ajustar el mo- 
ї=1 


delo anterior con los mínimos cuadrados de regre- 
sión. 

b) Ajuste un modelo de segundo orden con x, eli- 
minada por completo, es decir, elimine todos los 
términos que impliquen x,. Calcule los criterios de 
predicción para el modelo reducido. Comente qué 
tan adecuada es x, para predecir el coeficiente de 
transferencia de calor. 

c) Repita los incisos a) y b) para la eficacia térmica. 


12.66 En la fisiología del deporte una medición ob- 
jetiva de la condición física es el consumo de oxígeno 
en volumen por unidad de peso corporal por unidad de 
tiempo. Se estudiaron 31 individuos en un experimento 
con el fin de modelar el consumo de oxígeno en com- 
paración con la edad en años, х,, el peso en kilogramos, 
Xy el tiempo para correr 1 1/2 millas, Xy las pulsaciones 
en reposo, x,, las pulsaciones al final de la carrera, x,, y 
las pulsaciones máximas durante la carrera, x,. 

a) Realice una regresión por etapas a un nivel de sig- 
nificancia de 0.25 en la entrada. Proporcione el 
modelo final. 

b) Estudie todos los subconjuntos posibles usando s?, 
С, К? y КЇ. Tome una decisión y determine el 


ajus* 


modelo final. 


31 47.467 52 82.78 


12.67 Considere los datos del ejercicio de repaso 
12.64. Suponga que le interesa agregar algunos térmi- 
nos de “interacción”. En específico, considere el mo- 
delo 

yi = Bo + хи + хә + 3х3: + Во хіх; 

+ {@зх Хз + з X2iX3i + B123 X1iX2iX3i + €i. 

a) ¿Aún se tiene ortogonalidad? Comente al res- 
pecto. 

b) Con el modelo ajustado del inciso a), ¿puede usted 
encontrar intervalos de predicción y de confianza 
sobre la respuesta media? Explique su respuesta. 

c) Considere un modelo en el que se eliminó 
@ „х,х„х,. Para determinar si son necesarias las 


Pia" 
interacciones (como un todo), pruebe 


Ho: Вг = Вз = 8з =0. 


Proporcione el valor Р y saque conclusiones. 


12.68 Para extraer petróleo crudo se utiliza una téc- 
nica de inyección de dióxido de carbono (СО,). El flujo 
de CO, envuelve el petróleo y lo desplaza. En un ex- 
perimento se introducen tubos de flujo en muestras de 
cavidades de petróleo que contienen una cantidad co- 
nocida del mismo. Se utilizan tres valores diferentes de 


Ejercicios de repaso 


presión de flujo y tres valores diferentes de ángulos de 
introducción, las cavidades de petróleo se inyectan con 
CO, y se registra el porcentaje de petróleo desplazado. 
Considere el modelo 


yi = Bo + хи + хэ + Bu х1; 
+ 8х3, + хх + є. 


Ajuste el modelo anterior a los datos y sugiera cual- 
quier modificación al modelo que considere necesaria. 


Presión Ángulo de Recuperación de 
Ib/pulg?, x; inyección, x, petróleo, (%), y 

1000 0 60.58 

1000 15 72.72 

1000 30 79.99 

1500 0 66.83 

1500 15 80.78 

1500 30 89.78 

2000 0 69.18 

2000 15 80.31 

2000 30 91.99 


Fuente: Wang, G. C. “Microscopic Investigations of CO, 
Flooding Process”, Journal of Petroleum Technology, vol. 
34, núm. 8, agosto de 1982. 


12.69 Un artículo del Journal of Pharmaceutical 
Sciences (vol. 80, 1991) presenta datos de la solubili- 
dad de una fracción molar de un soluto a temperatura 
constante. También se midió la dispersión, x,, y los pa- 
rámetros de solubilidad del enlace bipolar y de hidró- 
geno, x, y х,. En la tabla siguiente se presenta una parte 
de los datos. En el modelo, y es el logaritmo negativo 
de la fracción molar. Ajuste el modelo 


у = bo + Вх: + х2: + 03X3; + є, 
para i = 1, 2,..., 20. 


Obs. y Xx хә Хз 
1 0.2220 7.3 0.0 0.0 
2 0.3950 87 0.0 0.3 
3 0.4220 8.8 0.7 1.0 
4 0.4370 8.1 4.0 0.2 
5 0.4280 9.0 0.5 1.0 
6 0.4670 8.7 1.5 2.8 
7 0.4440 9.3 2.1 1.0 
8 0.3780 7.6 5.1 3.4 
9 0.4940 10.0 0.0 0.3 

10 0.4560 8.4 3.7 4.1 
11 0.4520 9.3 3.6 2.0 
12 0.1120 77 2.8 7.1 
13 0.4320 9.8 4.2 2.0 
14 0.1010 7.3 25 6.8 
15 0.2320 8.5 2.0 6.6 
16 0.3060 9.5 2.5 5.0 
17 0.0923 7.4 2.8 7.8 
18 0.1160 7.8 2.8 7.7 
19 0.0764 7.7 3.0 8.0 
20 0.4390 10.3 1.7 4.2 
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a) Pruebe Ho: Bi = % = В = 0. 

b) Grafique los residuales estudentizados еп compa- 
ración соп x,, х, y x, (tres gráficas). Haga comen- 
tarios al respecto. 

c) Considere dos modelos adicionales que compitan 
con el modelo anterior: 


Modelo 2: Agregue 1 


2.2.2 
Modelo 3: Agregue хт, X3, X3, X1X2,X1X3, X2X3. 


Utilice PRESS y C, con estos tres modelos para 
saber cuál de los tres es el mejor. 


12.70 Se realizó un estudio para determinar si los 
cambios en el estilo de vida podrían sustituir la me- 
dicación para reducir la presión sanguínea de los indi- 
viduos hipertensos. Los factores considerados fueron 
una dieta saludable con un programa de ejercicios, la 
dosis común de medicamentos para la hipertensión y 
ningún tratamiento. También se calculó el índice de 
masa corporal (IMC) previo al tratamiento, debido a 
que se sabe que éste afecta la presión sanguínea. La 
respuesta considerada en este estudio fue el cambio en 
la presión sanguínea. La variable “grupo” tenía los si- 
guientes niveles. 


1 = Dieta saludable y programa de ejercicios 
2 = Medicación 
3 = Sin tratamiento 


a) Ajuste un modelo adecuado utilizando los datos 
anteriores. ¿Parece que el ejercicio y la dieta se 
pueden utilizar en forma eficaz para disminuir la 
presión sanguínea? Explique su respuesta a partir 
de los resultados. 

b) ¿El ejercicio y la dieta son una alternativa eficaz a 
la medicación? 

(Sugerencia: Para responder a estas preguntas quizás 
usted desee construir el modelo en más de una forma). 


Cambio en la 


presión sanguínea Grupo IMC 
—32 1 27.3 
—21 1 22.1 
—26 1 26.1 
—16 1 27.8 
—11 2 19.2 
—19 2 26.1 
—23 2 28.6 
—5 2 23.0 
—6 3 28.1 
5 3 25.3 
—11 3 26.7 
14 3 22.3 


12.71 Demuestre que al elegir el llamado mejor mo- 
delo del subconjunto de entre una serie de posibles 
modelos, elegir el modelo con la menor s? equivale a 
escoger el modelo con el А2, más pequeño. 


ajus 
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12.72 Estudio de caso: Considere el conjunto de da- 
tos para el ejercicio 12.12 de la página 452 (datos de un 


hospital) que se repite a continuación. 


a) 
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Los listados de resultados de la función PROC 
REG del SAS que se presentan en las figuras 12.9 y 
12.10 proporcionan una cantidad considerable de 
información. El propósito es detectar los valores 


Sitio xı х Хз X4 xs y extremos y, a final de cuentas, determinar cuáles 
1 15.57 2463 472.92 18.0 4.45 566.52 términos del modelo deben utilizarse en la versión 
44.02 2048 1339.75 95 6.92 696.82 final. 
3 20.42 3940 620.25 12.8 4.28 1033.15 = 
4 1876: 6505 56833 367 390 100362 P) A menudo ocurre que el papel que desempeña 
5 4920 5723 149760 357 550 1611.37 una sola variable regresora no es evidente cuando 
6 44.92 11,520 1365.83 24.0 4.60 1613.27 se estudia en presencia de otras variables; esto se 
7 55.48 5779 1687.00 43.3 5.62 1854.17 debe а la multicolinealidad. Con esto presente 
8 5928 5969 1639.92 467 515 2160.55 haga comentarios sobre la importancia de х, у х 
9 94.39 8461 2872.33 787 6.18 2305.58 зу 2-53 
10 128.02 20.106 3655.08 180.5 615 3503.93 еп el modelo completo en comparación con su im- 
11 96.00 13313 2912.00 60.9 5.88 3571.59 portancia en un modelo en el cual éstas son las 
12 131.42 10,771 3921.00 103.7 4.88 3741.40 únicas variables. 
13 127.21 15,543 3865.67 126.8 5.50 4026.52 су Comente acerca de qué otros análisis se tendrían 
14 252.90 36,194 7684.10 157.7 7.00 10,343.81 h 
15 409.20 34,703 12,446.33 169.4 10.75 11,732.17 A | i 
16 463.70 39.204 14098.40 331.4 7.05 15,414.94 Я) Elabore análisis apropiados y escriba sus conclu- 
17 510.22 86,533 15,524.00 371.6 6.35 18,854.45 siones respecto al modelo final. 
Dependent Variable: y 
Analysis of Variance 
Sum of Mean 
Source DE Squares Square F Value PEA Е 
Model 5 490177488 98035498 23779 <.0001 
Error a 4535052 412277 
Corrected Total 16 494712540 
Root MSE 642.08838 R-Square 0.9908 
Dependent Mean 4978.48000 Adj R-Sq 0.9867 
Coeff Var 12.89728 
Parameter Estimates 
Parameter Standard 
Variable Label DF Estimate Error t Value Рг > |t| 
Intercept Intercept 1 1962.94816 1071.36170 1.83 0.0941 
х1 Average Daily Patient Load 1 -15.85167 97.65299 -0.16 0.8740 
х2 Monthly X-Ray Exposure 1 0.05593 0.02126 2.63 0.0234 
x3 Monthly Occupied Bed Days 1 1.58962 3.09208 0.51 0.6174 
x4 Eligible Population in the 1 -4.21867 7.17656 -0.59 0.5685 
Area/100 
х5 Average Length of Patients 1 -394.31412 209.63954 -1.88 0.0867 


Stay in Days 


Figura 12.9: Salida de resultados del SAS para el ejercicio de repaso 12.72; parte 1. 


Ejercicios de repaso 
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95% CL Mean 


Dependent Predicted Std Error 
Variable Value Mean Predict 

566.5200 7750251 241.2323 244.0765 
696.8200 740.6702 331.1402 11.8355 
1033 1104 278.5116 490.9234 
1604 1240 268.1298 650.3459 
1611 1564 211.2372 1099 
1613 2151 279.9293 1535 
1854 1690 218.9976 1208 
2161 1736 468.9903 703.9948 
2306 2737 290.4749 2098 
3504 3682 5852517 2394 
3572 3239 189.0989 2823 
3741 4353 328.8507 3630 
4027 4257 314.0481 3566 
10344 8768 252.2617 8213 
11732 12237 573.9168 10974 
15415 15038 585.7046 13749 
18854 19321 599.9780 18000 

Std Error Student 

Obs Residual Residual Residual 

1 -208.5051 595.0 -0.350 

2 -43.8502 550.1 -0.0797 

3 -70.7734 578.5 -0.122 

4 363.1244 583.4 0.622 

5 46.9483 606.3 0.0774 

6 -538.0017 577.9 -0.931 

7 164.4696 603.6 0.272 

8 424.3145 438.5 0.968 

9 -431.4090 572.6 -0.753 

10 -177.9234 264.1 -0.674 

11 332.6011 613.6 0.542 

12 -611.9330 55165 -1.110 

13 -230.5684 560.0 -0.412 

14 1576 590.5 2.669 

15 -504.8574 287.9 -1.753 

16 376.5491 263.1 1.431 

17 -466.2470 228.7 -2.039 


95% CL Predict 


1306 -734.6494 
1470 -849.4275 
1717 -436.5244 
1831 -291.0028 
2029 76.6816 
2767 609.5796 
2172 196.5345 
2768 -13.8306 
3376 1186 
4970 1770 
3655 1766 
5077 2766 
4948 2684 
9323 7249 
13500 10342 
16328 13126 
20641 17387 
-2-1 012 


жж 


kkk 


ЖЖЖЖ 


ЖЖЖЖ 


жж 


2285 
2331 
2644 
2772 
3052 
3693 
3183 
3486 
4288 
5594 
4713 
5941 
5830 
10286 
14133 
16951 
21255 


Figura 12.10: Salida de resultados del SAS para el ejercicio de repaso 12.72; parte П. 
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12.13 Posibles riesgos y errores conceptuales; relación con el material 
de otros capítulos 


En este capítulo estudiamos varios procedimientos para usarlos en un “intento” por en- 
contrar el mejor modelo. Sin embargo, una de las confusiones más importantes en el tra- 
bajo de los científicos e ingenieros novatos es que existe un modelo lineal verdadero, y 
que es posible encontrarlo. En la mayoría de fenómenos de la ciencia las relaciones entre 
las variables científicas son de naturaleza no lineal y se desconoce el modelo verdadero. 
Los modelos estadísticos lineales son aproximaciones empíricas. 

En ocasiones, la decisión sobre cuál modelo adoptar depende de la información 
que se necesita obtener de éste. ¿Se usará para realizar predicciones? ¿Para explicar el 
papel que desempeña cada regresor? Esta “decisión” podría ser difícil ante la presencia 
de colinealidad. Es un hecho que para muchos problemas de regresión hay modelos 
múltiples con un desempeño muy similar. Para mayores detalles véase la referencia de 
Myers (1990). 

Uno de los abusos más nocivos del material de este capítulo consiste en dar dema- 
siada importancia a R? en la selección del llamado mejor modelo. Es importante recordar 
que para cualquier conjunto de datos se puede obtener una R? tan grande como se desee, 
dentro de la restricción de que 0 < R? < 1. Prestar demasiada atención а R? con fre- 
cuencia conduce a un sobreajuste. 

En este capítulo se dio mucha importancia a la detección de los valores extremos. 
Un clásico y grave abuso de la estadística radica en la decisión relacionada con la detec- 
ción de los valores extremos. Esperamos que quede claro que el analista no debería por 
ningún motivo detectar los valores extremos, eliminarlos del conjunto de datos, ajustar 
un modelo nuevo, informar sobre los valores extremos, y así sucesivamente. Se trata de 
un procedimiento tentador y desastroso para llegar a un modelo que se ajuste bien a los 
datos, el cual conlleva a un ejemplo de cómo mentir con estadísticos. Si se detecta un 
valor extremo, lo correcto es revisar la historia de los datos en busca de posibles errores 
de captura o de procedimiento antes de eliminarlos del conjunto de datos. Se debe re- 
cordar que, por definición, un valor extremo es aquel para el cual el modelo no se ajusta 
bien. El problema podría no estar en los datos sino en la selección del modelo. Cambiar 
el modelo quizás haría que el punto no se detecte como un valor extremo. 

Existen muchos tipos de respuestas que ocurren de forma natural en la práctica, 
pero que no se pueden utilizar en un análisis de mínimos cuadrados estándar porque sus 
supuestos de mínimos cuadrados clásicos no se cumplen. Los supuestos que suelen fallar 
son los de los errores normales y de la varianza homogénea. Por ejemplo, si la respuesta 
es una proporción, digamos la proporción de artículos defectuosos, la distribución de las 
respuestas se relaciona con la distribución binomial. Una segunda respuesta que ocurre 
con frecuencia en la práctica es la del conteo de Poisson. Evidentemente, la distribución 
no es normal, y la varianza de la respuesta, que es igual a la media de Poisson, varía de 
una observación a otra. Para conocer más detalles sobre estas condiciones poco ideales 
véase Myers y colaboradores (2008), citado en la bibliografía. 


Capítulo 13 


Experimentos con un solo factor: 
generales 


13.1 Técnica del análisis de varianza 


En el material sobre estimación y prueba de hipótesis que se cubrió en los capítulos 9 y 
10 en cada caso nos limitamos a considerar sólo dos parámetros de la población. Ése fue 
el caso, por ejemplo, en la prueba de la igualdad de dos medias de la población, en la 
cual se usaron muestras independientes de poblaciones normales con varianza común 
pero desconocida, y en donde se necesitaba obtener un estimado agrupado de сг. 

El material que se refiere a las inferencias de dos muestras representa un caso 
especial de lo que se denomina problema de un solo factor. Por ejemplo, en el ejer- 
cicio 10.35 de la página 357 se midió el tiempo de supervivencia para dos muestras 
de ratones, en donde una muestra recibió un tratamiento de suero contra la leucemia 
y la otra no lo recibió. En este caso decimos que hay un factor, es decir, un trata- 
miento, y el factor se halla en dos niveles. Si en el proceso de muestreo se utilizaran 
varios tratamientos en competencia, se necesitarían más muestras de ratones. En 
ese caso el problema implicaría un factor con más de dos niveles, por lo tanto, con 
más de dos muestras. 

En el problema de k > 2 muestras se supone que hay k muestras provenientes de k 
poblaciones. Un procedimiento muy común que se utiliza cuando se prueban medias de 
la población se denomina análisis de varianza, o ANOVA. 

Si el lector ha estudiado el material acerca de la teoría de la regresión, el análisis de 
varianza no será, por supuesto, una técnica nueva para él. Utilizamos el método del aná- 
lisis de varianza para partir la suma total de cuadrados en dos partes, una parte debida a 
la regresión y otra debida al error. 

Suponga que en un experimento industrial a un ingeniero le interesa la forma en que 
la absorción media de humedad del concreto varía para 5 agregados de concreto diferen- 
tes. Las muestras se exponen a la humedad durante 48 horas y se decide que para cada 
agregado deben probarse 6 muestras, lo que hace que se requiera probar un total de 30 
muestras. En la tabla 13.1 se presentan los datos registrados. 

El modelo que se considera para esta situación es el siguiente. Se tomaron 6 obser- 
vaciones de cada una de las 5 poblaciones, con medias Hp My. Hz respectivamente. 
Deseamos probar 


Ho: pi = 0 = = ps, 
Ну: Al menos dos de las medias по son iguales. 
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Tabla 13.1: Absorción de humedad en agregados para concreto 


Agregado: 1 2 3 4 5 


551 595 639 417 563 
457 580 615 449 631 
450 508 511 517 522 
731 583 573 438 613 
499 633 648 415 656 
632 517 677 555 679 


Total 3320 3416 3663 2791 3664 16,854 
Media 553.33 569.33 610.50 465.17 610.67 561.80 


Además, estamos interesados en realizar comparaciones individuales entre estas 5 те- 
dias de la población. 


Dos fuentes de variabilidad en los datos 


En el procedimiento del análisis de varianza se supone que cualquier variación que 
exista entre los promedios de los agregados se atribuye a 1) la variación en la absorción 
entre observaciones dentro de los tipos de agregados, y 2) la variación entre los tipos de 
agregados, es decir, a las diferencias en la composición química de los agregados. Por 
supuesto, la variación dentro de los agregados se debe a varias causas. Quizá las con- 
diciones de temperatura y humedad no se mantuvieron constantes durante el experi- 
mento. Es posible que haya habido cierta cantidad de heterogeneidad en los lotes de 
materias primas que se usaron. En todo caso debe considerarse la variación dentro 
de la muestra como una variación aleatoria o al azar. Parte del objetivo del análisis de 
varianza consiste en determinar si las diferencias entre las 5 medias muestrales son lo 
que se esperaría debido sólo a la variación aleatoria o si, más bien, se trata de una va- 
riación más allá de los simples efectos del azar, como las diferencias en la composición 
química de los agregados. 

En esta etapa surgen muchas preguntas acerca del problema anterior. Por ejemplo, 
¿Cuántas muestras deben probarse para cada agregado? Ésta es una pregunta que desafía 
continuamente al analista. Además, ¿qué pasaría si la variación dentro de la muestra 
fuera tan grande que al procedimiento estadístico le resultara difícil detectar las dife- 
rencias sistemáticas? ¿Es posible controlar de manera sistemática fuentes externas de 
variación y así eliminarlas de la parte que llamamos variación aleatoria? En las secciones 
siguientes intentaremos responder éstas y otras preguntas. 


13.2 La estrategia del diseño de experimentos 


En los capítulos 9 y 10 se estudiaron los conceptos de la estimación y la prueba de hipó- 
tesis para el caso de dos muestras, bajo la importante perspectiva de la manera en que se 
realiza el experimento. Esto forma parte de la categoría amplia de los diseños experimen- 
tales. Por ejemplo, para la prueba ѓ agrupada que se estudió en el capítulo 10, se supone 
que los niveles de los factores (los tratamientos en el ejemplo de los ratones) se asignan 
al azar a las unidades experimentales (los ratones). En los capítulos 9 y 10 analizamos el 


13.3 Análisis de varianza de un factor: diseño completamente aleatorizado (ANOVA de un factor) 509 


concepto de unidades experimentales y lo ilustramos por medio de varios ejemplos. En 
pocas palabras, las unidades experimentales son las unidades (ratones, pacientes, espe- 
címenes de concreto, tiempo) que proporcionan la heterogeneidad que conduce al 
error experimental en una investigación científica. La asignación aleatoria elimina el 
sesgo que podría originarse con una asignación sistemática. El objetivo consiste en dis- 
tribuir en forma uniforme entre los niveles de los factores los riesgos que introduce la 
heterogeneidad de las unidades experimentales. Una asignación al azar simula mejor las 
condiciones que se asumen en el modelo. En la sección 13.7 analizamos la formación 
de bloques en los experimentos. En los capítulos 9 y 10 se presentó el concepto, cuando 
se efectuaron comparaciones entre las medias usando el emparejamiento, es decir, la 
división de las unidades experimentales en pares homogéneos denominados bloques. 
Entonces, los niveles de los factores o tratamientos se asignan al azar dentro de los blo- 
ques. El propósito de la formación de bloques es reducir el error experimental efectivo. 
En este capítulo se extiende de manera natural el emparejamiento a bloques de tamaño 
mayor, con el análisis de varianza como la herramienta analítica principal. 


13.3 Análisis de varianza de un factor: diseño completamente 
aleatorizado (ANOVA de un factor) 


De k poblaciones se seleccionan muestras aleatorias de tamaño n. Las k poblaciones di- 
ferentes se clasifican con base en un criterio único, como tratamientos o grupos distintos. 
En la actualidad el término tratamiento se utiliza por lo general para designar las diver- 
sas clasificaciones, ya sean diferentes agregados, analistas, fertilizadores o regiones del 
país. 


Suposiciones e hipótesis del ANOVA de un solo factor 


Se supone que las k poblaciones son independientes y que están distribuidas en forma 
normal con medias Ш My.» He Y varianza común т?. Como se indicó en la sección 
13.2, estas suposiciones son más aceptables mediante la aleatoriedad. Se desean obtener 
métodos adecuados para probar las hipótesis 


Ho: ш = р =+: = hk, 
Hı: Al menos dos de las medias по son iguales. 


Sea que у, denote la j-ésima observación del ¡-ésimo tratamiento, y el acomodo de los 


datos es el que se observa en la tabla 13.2. Aquí, Y es el total de todas las observaciones 
de la muestra, del ¡-ésimo tratamiento, у, es la media de todas las observaciones en la 
muestra del ¿-ésimo tratamiento, Y.. es el total de todas las nk observaciones, y y... es 
la media de todas las nk observaciones. 


Modelo de ANOVA para un solo factor 


Cada observación puede escribirse en la forma 
Y = Hi + є, 
donde €, mide la desviación que tiene la observación j-ésima de la ¡-ésima muestra, con 


respecto de la media del tratamiento correspondiente. El término €, representa el error 
aleatorio y desempeña el mismo papel que los términos del error en los modelos de 
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Tabla 13.2: k muestras aleatorias 


Tratamiento: 1 2 a i ... k 

Уп У21 хе Yil Ы Yk1 

Ую. O => у 

Yin Y2n Yin Ykn 
Total Y Y +. Y; Е Үр Y. 
Мефа yo Н ОУ з= Je Уу. 


regresión. Una forma alternativa у preferible de esta ecuación se obtiene sustituyendo 


ш, = и + Q, sujeta a la restricción Уу о; = 0. Por lo tanto, se escribe 
і=1 


Yi =P + Qj + єу, 


donde џ tan sólo es la media general de todas las Hp es decir, 


A 
ре е2, 


у а, se denomina el efecto del ¡-ésimo tratamiento. 

La hipótesis nula de que k medias de la población son iguales, en comparación con 
la alternativa de que al menos dos de las medias son distintas, ahora se puede reemplazar 
por las hipótesis equivalentes. 


Ну: 01=0,=+»*:*=0=0, 
Н}: Al menos una de las а; no es igual a cero. 


Resolución de la variabilidad total en componentes 


Nuestra prueba se basará en una comparación de dos estimados independientes de la 
varianza poblacional común с>. Dichos estimadores se obtendrán haciendo la partición 
de la variabilidad total de nuestros datos, denotados mediante la sumatoria doble 


k n 
Ў A 


i=l ј=1 


en dos componentes. 


Teorema 13.1: Identidad de la suma de cuadrados 


k k n 
Yo сЕ S Aa = 
i j i=l 


i=l j=l 


En lo que sigue, será conveniente identificar los términos de la identidad de la suma 
de cuadrados con la siguiente notación: 
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Tres medidas k n 
importantes de STC = EN Уо» — 5)? = suma total de cuadrados, 
variabilidad i=l ј=1 


k 
SCT = п No: =)3. )? = suma de los cuadrados del tratamiento, 


i=l 


k n 
SCE = Уу; > Oy — ӯ; )? = suma de los cuadrados del error. 
i=l ј=1 


Entonces, la identidad de la suma de los cuadrados se puede representar simbólica- 
mente con la ecuación 


STC = SCT + SCE 


La identidad anterior expresa cómo las variaciones entre los tratamientos y dentro 
de los tratamientos contribuyen a la suma total de cuadrados. Sin embargo, se puede 
obtener mucha información si se investiga el valor esperado tanto de SCT como de SCE. 
Eventualmente calcularemos estimados de la varianza que determinan la razón que 


Teorema 13.2: k 
E(SCT) = (Е – 1)о?+ пу o; 
i=l 


La prueba del teorema se deja como ejercicio para el lector (véase el ejercicio 13.53 de la 
página 556). 

Si H, es verdadera, un estimado de с? basado en k— 1 grados de libertad es dado por 
la expresión: 


Media cuadrática 
del tratamiento s? 


Si H, es verdadera y por ello cada q, en el teorema 13.2 es igual a cero, se observa que 


в (5С \— 
К 1 


у s? es un estimado по sesgado de сг. Sin embargo, si H, es verdadera, se tiene que 
k 
SCT 2 n 2 
E | — | = о + — ат, 


у sí estima a 0? más un término adicional, que mide la variación debida a los efectos 
sistemáticos. 

Otro estimado independiente de о?, basado en k(n — 1) grados de libertad, es la 
fórmula familiar: 


Cuadrado medio 
del error 
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Resulta aleccionador puntualizar la importancia de los valores esperados de los 
cuadrados medios a los que recién nos referimos. En la sección siguiente se estudia el 
empleo de una razón Ё con el cuadrado medio del tratamiento en el numerador. Se 
observa que cuando H, es verdadera, la presencia de la condición K( 52) > E(s) sugiere 
que la razón F se utiliza en el contexto de una prueba unilateral de cola superior. 
Es decir, cuando Н, es verdadera se esperaría que el numerador sí fuera mayor que el 
denominador. 


Uso de la prueba F en el ANOVA 


El estimado s? es no sesgado, independientemente de la veracidad o falsedad de la hipó- 
tesis nula (véase el ejercicio de repaso 13.52 de la página 556). Es importante señalar 
que la identidad de la suma de cuadrados ha hecho la partición no sólo de la variabilidad 
total de los datos, sino también del número total de grados de libertad. Es decir, 


nk—1=k-1+ и – 1). 


Razón F para probar Іа igualdad de las medias 


Cuando H, es verdadera, la razón f = sí /s? es un valor de la variable aleatoria F, que 
tiene la distribución F con k — 1 y k(n — 1) grados de libertad (véase el teorema 8.8). 
Como 5? sobrestima a 0? cuando H, es falsa, se tiene una prueba de una cola con la re- 
gión crítica localizada por completo en la cola derecha de la distribución. 

A un nivel de significancia de о se rechaza la hipótesis nula H, cuando 


f> falk — 1,k(n — П). 
Otro método, el del valor P, sugiere que la evidencia a favor o en contra de H, es 
P=P{fik-1, kn—-D1>f). 


Los cálculos para un problema de análisis de varianza por lo general se resumen en 
forma tabular, como se observa en la tabla 13.3. 


Tabla 13.3: Análisis de varianza para el ANOVA de un solo factor 


Fuente de Suma de Grados de Cuadrados f 
variación cuadrados libertad medios calculada 
SCT s? 
: 2_ 1 
Tratamientos SCT k=1 ML 52 
SCE 
Error SCE k(n — 1) 52 = Кл =) 
Тош STC kn — 1 
Ejemplo 13.1: | Pruebe la hipótesis de que р, = 4, =... = Ш, a un nivel de significancia de 0.05 para los 


datos de la tabla 13.1 sobre la absorción de humedad por varios tipos de agregados para 
cemento. 
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Solución: Las hipótesis son 


Ho: pi ==: = ps, 
H: Al menos dos de las medias no son iguales. 
а = 0.05 


Región crítica: f > 2.76 сопу = 4 y v, = 25 grados de libertad. Los cálculos de la suma 
de cuadrados proporcionan 


STC = 209,377, SCT = 85,356, 
SCE = 209,377 — 85,356 = 124,021. 


En la figura 13.1 se presentan estos resultados y el resto de los cálculos del procedimien- 
to ANOVA del programa SAS. 


The GLM Procedure 


Dependent Variable: moisture 


Sum of 

Source DF Squares Mean Square F Value Pr > F 
Model 4 85356.4667 21339.1167 4.30 0.0088 
Error 25 124020.3333 4960.8133 
Corrected Total 29 209376.8000 

R-Square Coeff Var Root MSE moisture Mean 

0.407669 12.53703 70.43304 561.8000 
Source DF Type I SS Mean Square F Value PE > F 
aggregate 4 85356.46667 21339.11667 4.30 0.0088 


Figura 13.1: Salida de resultados del programa SAS para el procedimiento de análisis de varianza. 


Decisión: Rechazar H, y concluir que los agregados no tienen la misma media de absor- 
ción. El valor P para f = 4.30 es 0.0088, que es menor que 0.05. JJ 

Además del ANOVA, se construyeron gráficas de caja para cada agregado, las cua- 
les se presentan en la figura 13.2. Al observar las gráficas vemos que es evidente que no 
todos los agregados tienen la misma absorción. De hecho, parece que el agregado 4 des- 
taca del resto. En el ejercicio 13.21 de la página 531 se incluye un análisis más formal 
que revela este resultado. 

Durante el trabajo experimental es frecuente que se pierdan algunas de las observacio- 
nes deseadas. Los animales experimentales mueren, el material experimental se daña o los 
seres humanos abandonan el estudio. El análisis anterior para el mismo tamaño de la mues- 
tra aún es válido si modificamos ligeramente las fórmulas de la suma de cuadrados. Ahora 
suponemos que las k muestras aleatorias son de tamaño л, 7,,..., п,, respectivamente. 


Suma de cuadrados; 
tamaños desiguales 
de las muestras 


k ni k 
STC =Y Y (yy —5.), SCT = Y ni0, —5.)?, SCE = STC — SCT 


і=1 j=1 і=1 
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Figura 13.2: Gráficas de caja para la absorción de la humedad en agregados de concreto. 


Después se hace la partición de los grados de libertad, como antes: N— 1 рага STC, k— 1 


para SCT y N-1-—(k-— 1) = N -k para SCE, donde N = У. 


i=l 


Ejemplo 13.2: | Parte de un estudio realizado en Virginia Tech se diseñó para medir los niveles de activi- 
dad de la fosfatasa alcalina sérica (en unidades de Bessey-Lowry) en niños con trastor- 
nos convulsivos que recibían terapia de anticonvulsivantes bajo el cuidado de un médico 
privado. Se reclutaron 45 sujetos para el estudio y se clasificaron en cuatro grupos de 
medicamentos: 


G-1: Control (no recibieron anticonvulsivantes ni tenían historia de trastornos 
convulsivos) 


G-2: Fenobarbital 
G-3: Carbamazepina 
G-4: Otros anticonvulsivantes 


De las muestras de sangre tomadas a cada sujeto se determinó el nivel de actividad de la 
fosfatasa alcalina sérica y se registró tal como se observa en la tabla 13.4. Pruebe la hi- 
pótesis de que, a un nivel de significancia de 0.05, el nivel promedio de actividad de la 
fosfatasa alcalina sérica es el mismo para los cuatro grupos de medicamentos. 


13.3 Análisis de varianza de un factor: diseño completamente aleatorizado (ANOVA de un factor) 


Tabla 13.4: Nivel de actividad de la fosfatasa alcalina sérica 


G-1 G-2 G-3 G-4 
49.20 97.50 97.07 62.10 110.60 
44.54 105.00 73.40 94.95 57.10 
45.80 58.05 68.50 142.50 117.60 
95.84 86.60 91.85 53.00 77.71 
30.10 58.35 106.60 175.00 150.00 
36.50 72.80 0.57 79.50 82.90 
82.30 116.70 0.79 29.50 111.50 
87.85 45.15 0.77 78.40 

105.00 70.35 0.81 127.50 
95.22 77.40 
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Solución: А un nivel de significancia de 0.05, las hipótesis son 


Ho: ш = Ma = pa = |а, 


Н: Al menos dos de las medias no son iguales. 


Región crítica: f > 2.836, al interpolar los valores de la tabla А.б. 
Cálculos: Y, = 1460.25, Y, = 440.36, Y, = 842.45, Y, = 707.41 y Y. = 3450.47. El 


1 3 
análisis de varianza se incluye en la salida de resultados de MINITAB que se presenta en 


la figura 13.3. 


One-way ANOVA: G-1, G-2, G-3, G-4 

Source DF 55 М5 Е P 

Factor 3 13939 4646 кА 0.022 

Error 41 53376 1302 

Total 44 67315 

S = 36.08 R-8q = 20.713 R-Sgqladj ) = 14.90% 
Individual 95% CIs For Mean Based on 
Pooled StDev 

Level N Mean StDev Spas +--------- is ta +------- 

G-1 20 73.01 20:19 (----*----- ) 

G-2 9 48.93 47.11 (------- Жашаш ынын ) 

G-3 9 93.61 46.57 (------- ыы ) 

G-4 7 101.06 30.76 (-------- Ese ) 
--+--------- +--------- +--------- +------- 
30 60 90 120 


Pooled StDev = 36.08 


Figura 13.3: Análisis de MINITAB para los datos de la tabla 13.4. 
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Decisión: Rechazar H, y concluir que los niveles de actividad promedio de la fosfatasa 
alcalina sérica para los cuatro grupos de medicamentos no son los mismos. El valor 
calculado de Р es 0.022. J 

Para concluir nuestro estudio del análisis de varianza para la clasificación de un solo 
factor mencionaremos las ventajas de elegir muestras del mismo tamaño en vez de otras de 
tamaños distintos. La primera ventaja es que la razón fno es sensible a pequeñas desvia- 
ciones de la suposición de varianzas iguales para las k poblaciones cuando las muestras 
son del mismo tamaño. La segunda consiste en que muestras del mismo tamaño minimi- 
zan la probabilidad de cometer un error tipo П. 


13.4 Pruebas de la igualdad de varias varianzas 


Aunque la razón f que se obtiene con el procedimiento del análisis de varianza no 
es sensible a las desviaciones de la suposición de varianzas iguales para las k poblaciones 
normales cuando las muestras son de igual tamaño, debe tenerse precaución y efectuar 
una prueba preliminar sobre la homogeneidad de las varianzas. En el caso de muestras 
de tamaños distintos, salta a la vista que es aconsejable realizar una prueba como ésa, si 
existe duda razonable acerca de la homogeneidad de las varianzas de la población. Por 
lo tanto, suponga que se desea probar la hipótesis nula 


2 2 
Ho: а? = д2 =... =0{ 
еп comparación con la alternativa 
Н,: No todas las varianzas son iguales. 


La prueba que usaremos, denominada prueba de Bartlett, se basa en un estadístico 
cuya distribución muestral proporciona valores críticos exactos cuando los tamaños de 
las muestras son iguales. Dichos valores críticos para tamaños de las muestras iguales 
también se pueden utilizar para obtener aproximaciones muy exactas de los valores crí- 
ticos para tamaños muestrales distintos. 


: : 2 2 
En primer lugar calculamos las k varianzas muestrales 5;, s; 


9. . 
2, Sí a partir de 


k 

muestras de tamaño hy Tys П CON Y n, = М. En segundo lugar combinamos las va- 
i=1 

rianzas muestrales para obtener la estimación agrupada 


k 
1 
Š ояу 
Sp o Ds. 
Ahora, 
a A O ra al 7-0 


2 
5р 


b= 


es un valor de una variable aleatoria B que tiene la distribución de Bartlett. Para el 
caso especial en que n, = n, = = = п, = n, se rechaza H, a un nivel de significancia 
Q 51 


b < (оп), 
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donde b(a; n) es el valor crítico que deja una área de tamaño о en el extremo izquierdo 
de la distribución de Bartlett. En la tabla A.10 se incluyen los valores críticos, b (œ; n), 
рага а = 0.01 y 0.05; k = 2, 3, ..., 10; y valores seleccionados de n, desde 3 hasta 100. 

Cuando los tamaños de las muestras son distintos, se rechaza la hipótesis nula al 
nivel de significancia о si 


b < (05 пу, пә,..., Nk), 
donde 


nibe (œn) + n2b(0,n2) + + + па (Опр) 
М . 


(05 п, по,..., Nx) = 


Igual que antes, todas las Б,(0; n,) para los tamaños muestrales n,, n,,..., п, se obtienen de 
la tabla A.10. 


Ejemplo 13.3: | Utilice la prueba de Bartlett a un nivel de significancia de 0.01 para probar la hipótesis 
de que las varianzas de la población de los cuatro grupos de medicamentos del ejemplo 
13.2 son iguales. 
Solución: Tenemos la hipótesis 


а OS PROS OS. 
H; с = 04 = 0; = 0% 
Н: Las varianzas no son iguales, 


соп а = 0.01. 


Región crítica: Si nos remitimos al ejemplo 13.2, tenemos que n, = 20, n, = 9, п, = 9, 
n, = 7, N = 45 y k = 4. Por lo tanto, se rechaza cuando 


b < b4(0.01; 20, 9, 9, 7) 
_ (20)(0.8586) + ( 9)(0.6892) + ( 9)(0.6892) + ( 7)(0.6045) 
й 45 


= 0.7513. 
Cálculos: El primero se obtiene 


52 = 662.862, 52 = 2219.781, 52 = 2168.434, 52 = 946.032, 


y después 
Es (19)(662.862) + (8)2219.781) + (8)Q168.434) + (6)(946.032) 
po 41 
= 1301.861. 
Ahora, 
19 8 8 631/41 
p= [(662.862)'” (2219.781)° (2168.434)° (946.032)°] — 0.8557. 


1301.861 


Decisión: no rechazar la hipótesis y concluir que las varianzas de la población de los 
cuatro grupos de medicamentos no son significativamente distintas. 

Aunque la prueba de Bartlett se utiliza con mayor frecuencia para probar la homo- 
geneidad de varianzas, se dispone de otros métodos. Un método creado por Cochran 
proporciona un procedimiento de cálculo sencillo, aunque está limitado a situaciones en 
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que los tamaños muestrales son iguales. La prueba de Cochran es especialmente útil 
para detectar si alguna de las varianzas es mucho mayor que las demás. El estadístico 
que se emplea es: 

S? más grande 


G= ==, 
Ls? 
i=1 


> 


y se rechaza la hipótesis de igualdad de varianzas si g > g,, donde el valor de g, se ob- 
tiene de la tabla A.11. 

Para ilustrar la prueba de Cochran nos remitiremos otra vez a los datos de la tabla 
13.1 sobre la absorción de humedad de los agregados para concreto. ¿Se justificó la su- 
posición de varianzas iguales al realizar el análisis de varianza en el ejemplo 13.1? Se 
encontró que 


52 = 12,134, 52 = 2303, 52 = 3594, 52 = 3319, s? = 3455. 


Por Іо tanto, 


_ 12,134 
5 = 24,805 


= 0.4892, 


que no excede el valor de la tabla g, ,, = 0.5065. En consecuencia, se concluye que es 


razonable la suposición de que las varianzas son iguales. 


Ejercicios 


13.1 Se están considerando seis máquinas diferentes 
para la fabricación de sellos de goma y se están compa- 
rando con respecto a la resistencia a la tensión del pro- 
ducto. Se utiliza una muestra aleatoria de cuatro sellos 
hechos con cada máquina para determinar si la resis- 
tencia media a la tensión varía de una máquina a otra. 
A continuación se presentan las medidas de la resisten- 
cia a la tensión en kilogramos por centímetro cuadrado 
х 107: 


Máquina 
1 2 3 4 5 6 
17.5 164 20.3 146 17.5 18.3 
16.9 192 15.7 167 19.2 16.2 
15.8 17.7 17.8 20.8 16.5 17.5 
18.6 15.4 18.9 18.9 20.5 20.1 


Realice el análisis de varianza a un nivel de significan- 
cia de 0.05 e indique si la resistencia promedio a la 
tensión de las seis máquinas difiere o no de manera sig- 
nificativa. 


13.2 Los datos que se presentan en la siguiente tabla 
representan el número de horas de alivio proporciona- 
das por cinco marcas diferentes de tabletas para el do- 
lor de cabeza administradas a 25 sujetos que tenían 
fiebre de 38°С o más. Realice el análisis de varianza y, 
a un nivel de significancia de 0.05, pruebe la hipótesis 
de que las cinco marcas proporcionan el mismo núme- 
ro medio de horas de alivio. Analice los resultados. 


Tabletas 
A B C D E 
52 91 32 24 7.1 
47 71 58 34 6.6 
81 82 22 41 93 
62 60 3.1 10 42 


13.3 En el artículo “Shelf-Space Strategy in Retailing”, 
que se publicó en Proceedings: Southern Marketing Asso- 
ciation, se investigó el efecto que tenía la altura de los 
anaqueles en los supermercados sobre las ventas de ali- 
mento enlatado para perro. Durante un periodo de 8 días 
se llevó a cabo un experimento en un supermercado pe- 
queño acerca de las ventas de una marca de alimento para 
perro conocida como Arf y se utilizaron tres niveles de 
altura de anaquel: a las rodillas, a la cintura y a los ojos. 
Cada día se cambió al azar tres veces la altura del anaquel 
en la que estaba dicho alimento. Las secciones restantes 
de la góndola que contenía la marca dada se llenaban con 
una mezcla de marcas de comida canina, las cuales resul- 
taban tanto familiares como desconocidas para los consu- 
midores de esa área geográfica específica. Se presentan las 
ventas diarias, expresadas en cientos de dólares, del ali- 
mento Arf para las tres alturas del anaquel. Con base en 
los datos, ¿existe una diferencia significativa en el prome- 
dio de ventas diarias de dicho alimento, con base en la al- 
tura del anaquel? Utilice un nivel de significancia de 0.01. 


Ejercicios 


Altura de anaquel 


Nivel de Nivel de Nivel de 
las rodillas la cintura los ojos 

77 88 85 

82 94 85 

86 93 87 

78 90 81 

81 91 80 

86 94 79 

77 90 87 

81 87 93 


13.4 La inmovilización de los venados silvestres de 
cola blanca usando tranquilizantes da a los investigadores 
la oportunidad de estudiarlos de cerca y obtener informa- 
ción fisiológica valiosa. En el estudio denominado /n- 
fluence of Physical Restraint and Restraint Facilitating 
Drugs on Blood Measurements of White-Tailed Deer and 
Other Selected Mammals, realizado en Virginia Tech, los 
biólogos de la vida silvestre probaron el tiempo del “de- 
rribamiento” (el periodo transcurrido entre la inyección y 
la inmovilización) de tres sustancias inmovilizadoras dis- 
tintas. En este caso la inmovilización se define como el 
punto en que el animal ya no tiene control muscular sufi- 
ciente para permanecer de pie. Se asignaron 30 venados 
machos de cola blanca al azar a cada uno de tres trata- 
mientos. El grupo A recibió 5 miligramos de cloruro de 
sucinilcolina líquida (SCC); al grupo B se le suministra- 
ron 8 miligramos de SCC en polvo; y al grupo C, 200 
miligramos de hidrocloruro de fenciclidina. A continua- 
ción se presentan los tiempos de derribamiento, en minu- 
tos. Haga un análisis de varianza a un nivel de 
significancia de 0.01 y determine si el tiempo promedio 
de derribamiento es o no igual para las tres sustancias. 


Grupo 
A B C 
11 10 4 
5 7 4 
14 16 6 
7 7 3 
10 7 5 
7 5 6 
23 10 8 
4 10 3 
11 6 7 
11 12 3 
135 La enzima mitocondrial  transhidrogenasa 


NADPH:NAD, de la tenia de la rata común (Hymenole- 
piasis diminuta) cataliza el hidrógeno en la transferencia 
de NADPH a NAD, lo que produce NADH. Se sabe que 
esta enzima desempeña un papel vital en el metabolismo 
anaerobio de la tenia, y recientemente se planteó la hipó- 
tesis de que podría servir como una bomba de intercam- 
bio de protones, es decir, para transferir protones a través 
de la membrana mitocondrial. Un estudio sobre el Effect 
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of Various Substrate Concentrations on the Conforma- 
tional Variation of the NADPH:NAD Transhydrogenase 
of Hymenolepiasis diminuta llevado a cabo por la 
Bowling Green State University, se diseñó para evaluar 
la capacidad de dicha enzima para sufrir cambios en su 
conformación o su forma. Podría considerarse que los 
cambios en la actividad específica de la enzima ocasio- 
nados por las variaciones en la concentración de NADP 
sustentan la teoría del cambio de conformación. La enzi- 
ma en cuestión se localiza en la membrana interior de las 
mitocondrias de la tenia. Se homogeneizaron las tenias y 
se aisló la enzima mediante una serie de centrifugacio- 
nes. Después se agregaron diferentes concentraciones de 
NADP a la solución de enzima aislada y la mezcla se 
incubó durante tres minutos en un baño de agua a 56°С. 
Luego, se analizó la enzima con un espectrómetro de 
rayo dual y se calcularon los resultados que se presentan 
a continuación, en términos de la actividad específica de 
la enzima, en nanomoles por minuto por miligramo 
de proteína. Pruebe la hipótesis de que la actividad espe- 
cífica promedio es la misma para las cuatro concentra- 
ciones, a un nivel de significancia de 0.01. 


Concentración de NADP (nm) 


0 80 160 360 
11.01 11.38 11.02 | 6.04 10.31 
12.09 10.67 10.67 | 8.65 8.30 
10.55 12.33 11.50 | 7.76 9.48 
11.26 10.08 10.31 | 10.13 8.89 

9.36 


13.6 Un estudio midió la tasa de ѕогсібп (ya sea ab- 
sorción o adsorción) de tres tipos diferentes de solventes 
químicos orgánicos. Estos solventes se utilizan para 
limpiar partes industriales metálicas, y son desechos 
potencialmente riesgosos. Se probaron muestras inde- 
pendientes de solventes de cada tipo y se registraron 
sus tasas de sorción como un porcentaje molar. (Véase 
McClave, Dietrich y Sincich, 1997). 


Aromáticos| Cloroalcalinos | Ésteres 

1.06 0.95 1.58 1.12 0.29 0.43 0.06 
0.79 0.65 1.45 0.91 0.06 0.51 0.09 
0.82 1.15 0.57 0.83 0.44 0.10 0.17 
0.89 1.12 1.16 0.43 0.55 0.53 0.17 
1.05 0.61 0.34 0.60 


¿Existe una diferencia significativa en la tasa promedio 
de sorción de los tres solventes? Utilice un valor P para 
sus conclusiones. ¿Qué solvente usaría? 


13.7 Se ha demostrado que el fertilizante fosfato 
amoniacal de magnesio, MgNH,PO,, es un proveedor 
eficaz de los nutrientes necesarios para el crecimiento 
de las plantas. Los compuestos que suministra son muy 
solubles en agua, lo cual permite su aplicación directa 
sobre la superficie del suelo o que se mezcle con el 
sustrato de crecimiento durante el proceso de encapsu- 
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lamiento. Se efectuó un estudio denominado Effect of 
Magnesium Ammonium Phosphate on Height of Chry- 
santhemums en George Mason University para deter- 
minar el nivel óptimo posible de la fertilización con 
base en la mejoría de la respuesta de crecimiento verti- 
cal del crisantemo. Se dividieron 40 semillas de crisan- 
temo en 4 grupos de diez plantas cada uno. Se sembró 
cada una en una maceta similar que contenía un medio 
uniforme de crecimiento. Se agregó a cada grupo de 
plantas una concentración cada vez mayor de MgNH- 
¿PO,, medido en gramos por bushel. Los cuatro grupos 
de plantas se cultivaron durante cuatro semanas en con- 
diciones uniformes en un invernadero. A continuación 
se presentan los tratamientos y los cambios respectivos 
de sus alturas, medidas en centímetros: 


Tratamiento 
50 g/bu 100 g/bu | 200 g/bu | 400 g/bu 
132 12.4 |160 126 | 78 144 |21.0 14.8 
128 172 |148 13.0 |20.0 15.8 |19.1 15.8 
130 14.0 | 14.0 23.6 |17.0 27.0 |18.0 26.0 
142 21.6 | 14.0 17.0 | 19.6 18.0 [21.1 22.0 
15.0 20.0 | 22.2 244 | 20.2 23.2 |25.0 18.2 
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A un nivel de significancia de 0.05, ¿podría concluirse 
que concentraciones diferentes de MgNH,PO, afectan 
la altura promedio que alcanzan los crisantemos? ¿Qué 
cantidad del fertilizante parece ser la mejor? 


13.8 Para el conjunto de datos del ejercicio 13.7 use 
la prueba de Bartlett para probar si las varianzas son 
iguales. Utilice œ = 0.05. 


13.9 Utilice la prueba de Bartlett a un nivel de signi- 
ficancia de 0.01 para probar la homogeneidad de las 
varianzas en el ejercicio 13.5 de la página 519. 


13.10 Utilice la prueba de Cochran a un nivel de sig- 
nificancia de 0.01 para probar la homogeneidad de las 
varianzas en el ejercicio 13.4 de la página 519. 


13.11 Utilice la prueba de Bartlett a un nivel de signi- 
ficancia de 0.05 para probar la homogeneidad de las 
varianzas en el ejercicio 13.6 de la página 519. 


13.5 Comparaciones de un grado de libertad 


Definición 13.1: 


El análisis de varianza en la clasificación de un solo factor, o experimento de un solo 
factor, como se le denomina con frecuencia, tan sólo indica si puede rechazarse o no la 
hipótesis de medias de tratamientos iguales. Por lo general, el experimentador preferiría 
efectuar un análisis más profundo. Como ilustración, en el ejemplo 13.1, mediante el 
rechazo de la hipótesis nula, concluimos que las medias no son iguales, pero aún no sa- 
bemos en dónde residen las diferencias entre los agregados. Es probable que el ingeniero 
intuya de antemano que los agregados 1 y 2 deberían poseer propiedades similares de 
absorción, al igual que los agregados 3 y 5. Sin embargo, sería interesante estudiar las 
diferencias entre los dos grupos. Así, parece apropiado probar las hipótesis 


Ho: ш + a — из — Hs = 0, 
Hi: ш + po — Шз — Hs #0. 


Se observa que la hipótesis es una función lineal de las medias de la población, en las 
cuales los coeficientes suman cero. 


Cualquier función lineal de la forma 
k 
w= >) cp, 
i=1 
k 


donde De = 0 se llama comparación o contraste en las medias de los tratamientos. 
ї=1 

Con frecuencia el experimentador puede hacer comparaciones múltiples probando la 

significancia de los contrastes de las medias de los tratamientos, es decir, probando una 

hipótesis del siguiente tipo: 
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Hipótesis para un k 
contraste Ho: 5 сш; = 0, 


і=1 


k 
Hi: > сш +0, 
i i=l 
donde У) c; = 0. 


i=l 


La prueba se efectúa calculando primero un contraste similar de las medias de las muestras, 


k 
w = > Ci Yie 
і=1 


Como Y, Ү,,..., Y, son variables aleatorias independientes que tienen distribuciones 
gi . . 2 КА p . 

normales con medias рш, H,- H, Y Varianzas 0;/n,, 07/N,,..., С, /M,, respectivamente, 

el teorema 7.11 nos garantiza que w es un valor de la variable aleatoria normal W con 


k k 2 
. r С. 
media Шу = у сш y varianza оу = о? > L, 


и; 
¡=1 i=1 


Por lo tanto, cuando A, es verdadera, р, = 0 y, según el ejemplo 7.5, el estadístico 


Ww o Nena 


ї=1 


se distribuye como una variable aleatoria chi cuadrada con 1 grado de libertad. 


Estadístico de Nuestra hipótesis se prueba a un nivel de significancia œ calculando 


prueba para ‚ К К | 
probar un м PEN 


2 


k K 
52 У (с? /ni) 52 Y (2 /т) 
[=1 


i=1 


Aquí fes un valor de la variable aleatoria F que tiene distribución F con 1 y N—k grados 
de libertad. 
Cuando los tamaños de las muestras son iguales a n, 


La cantidad SCw, que se denomina suma de cuadrados de los contrastes, indica la 
parte de la SCT que se explica por el contraste en cuestión. 
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Esta suma de cuadrados se empleará para probar la hipótesis de que 


k 
Уо = 0). 
і=1 


Con frecuencia es de interés probar contrastes múltiples, en particular contrastes que son 
linealmente independientes u ortogonales. Como resultado, se vuelve necesaria la si- 
guiente definición: 


Definición 13.2: Se dice que los dos contrastes 


k k 
ш = X bipi y а = с 
i=l i=l 


k 
son ortogonales, si У) b;c;/n; = 0, o bien, cuando las n,son iguales a n, si 
i=l 
k 
} bici = 0. 
і=1 


Si ш, у w, son ortogonales, entonces las cantidades SCw, у SCw, son componentes 
de SCT, cada una con un solo grado de libertad. La suma de cuadrados de los tratamien- 
tos con k— 1 grados de libertad se puede dividir еп, a lo sumo, k — 1 sumas de cuadrados 
de contrastes independientes con un solo grado de libertad que satisfacen la identidad 


SCT = SCw, + SCw, + + + SCw 


k-1? 


si los contrastes son ortogonales entre sí. 


Ejemplo 13.4: | Remítase al ejemplo 13.1 y calcule la suma de cuadrados de los contrastes que corres- 
ponden a los contrastes ortogonales 


шл = Шш + a — Ma — Hs, W2 = ш + a + — 4 + ps, 


y efectúe las pruebas de significancia adecuadas. En este caso es de interés a priori com- 
parar los dos grupos (1, 2) y (3, 5). Un contraste importante e independiente consiste en 
realizar la comparación entre el conjunto de agregados (1, 2, 3, 5) y el agregado 4. 


Solución: Es evidente que los dos contrastes son ortogonales, puesto que 


00 + 00) + DO + (0964 + EDA) = 0. 


El segundo contraste indica una comparación entre los agregados (1, 2, 3 y 5) y el agre- 
gado 4. Podemos escribir dos contrastes adicionales ortogonales a los dos primeros, es 
decir: 

ш, =p, – H, (agregado 1 contra agregado 2), 

Ww, = H, — H, (agregado 3 contra agregado 5). 
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De los datos de la tabla 13.1, se tiene que 


(3320 + 3416 — 3663 — 3664)? 
6+ (D+ (=D + (=1)7] 


ссу, — 8320 + 3416 + 3663 + 3664 — 42791) P 
"= MORO + (02 + (92 E 


Си = = 14, 553, 


= 70, 035. 


En la tabla 13.5 se presenta un análisis de varianza más extenso. Se observa que las dos 
sumas de cuadrados de los contrastes explican casi toda la suma de cuadrados de 
los agregados. Existe una diferencia significativa entre las propiedades de absorción 
de los agregados, y el contraste w, es significativo marginalmente. Sin embargo, el valor 
fde 14.12 para w, es muy significativo, y se rechaza la hipótesis 


Ho: ш + a + Из + us = 44 


Tabla 13.5: Análisis de varianza usando contrastes ortogonales 


Fuente de variación Suma de Gradosde Cuadrado f 
cuadrados libertad medio calculada 
Agregados 85,356 4 21,339 4.30 
(1,2) vs. (3,5) ү { 1 o 2.93 
(1,2,3,5) vs. 4 70,035 1 70,035 14.12 
Error 124,021 25 4961 
Total 209,377 29 


Los contrastes ortogonales permiten al profesional dividir la variación del trata- 
miento en componentes independientes. Por lo general el experimentador tiene interés 
en hacer ciertos contrastes. Eso ocurrió en nuestro ejemplo, donde las consideraciones 
a priori sugerían que los agregados (1, 2) y (3, 5) constituían grupos distintos con pro- 
piedades diferentes de absorción, un planteamiento que no obtuvo mucho respaldo con 
la prueba de significancia. Sin embargo, la segunda comparación apoyó la conclusión de 
que el agregado 4 parecía “destacar” de los demás. En este caso no fue necesaria la 
partición completa de SCT, dado que dos de las cuatro comparaciones independientes 
posibles explicaban la mayor parte de la variación en los tratamientos. 

En la figura 13.4 se presenta un procedimiento GLM del programa SAS, que propor- 
ciona un conjunto completo de contrastes ortogonales. Observe que la suma de cuadrados 
de los cuatro contrastes se agrega a la suma de cuadrados de los agregados. Asimismo, 
note que los últimos dos contrastes (1 contra 2, 3 contra 5) revelan comparaciones in- 
significantes. 


13.6 Comparaciones múltiples 


El análisis de varianza es un procedimiento poderoso para probar la homogeneidad de un 
conjunto de medias. No obstante, si se rechazara la hipótesis nula y se aceptara la alter- 
nativa que se planteó (que no todas las medias son iguales), aún no se sabría cuáles de 
las medias de la población son iguales y cuáles son diferentes. 
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The GLM Procedure 


Dependent Variable: moisture 


Sum of 

Source DF Squares Mean Square F Value Pr > Е 
Model 4 85356.4667 21339.1167 4.30 0.0088 
Error 25 124020.3333 4960.8133 
Corrected Total 29 209376.8000 

R-Square Coeff Var Root MSE moisture Mean 

0.407669 12453703 70.43304 561.8000 
Source DF Type I SS Mean Square F Value Pr > F 
aggregate 4 85356.46667 21339.11667 4.30 0.0088 
Source DF Type III SS Mean Square F Value Pr > F 
aggregate 4 85356.46667 21339.11667 4.30 0.0088 
Contrast DF Contrast SS Mean Square F Value РЕ > F 
(1,2,3,5) vs. 4 1 70035.00833 70035.00833 14.12 0.0009 
(L, 2) vss. (3,5) Jl 14553.37500 14553.37500 27.98 0.0991 
1 vs. 2 1 768.00000 768.00000 0.15 0.6973 
3 vs. 5 1 0.08333 0.08333 0.00 0.9968 


Figura 13.4: Un conjunto de contrastes ortogonales. 


A menudo es de interés efectuar varias comparaciones por pares (quizá todas las 
que sean posibles) entre los tratamientos. En realidad, una comparación por pares se 
puede ver como un contraste simple, es decir, una prueba de 


Ho: pi шу =0, 
Hi — Hj +0, 

para toda i + j. Hacer todas las comparaciones posibles por pares entre las medias puede 
ser muy benéfico cuando no se conocen a priori contrastes complejos particulares. Por 
ejemplo, suponga que se desea probar las hipótesis siguientes, con los datos de los agre- 
gados de la tabla 13.1: 

Ho: ш — Hs = 0, 

Hi: Hı — Hs + 0. 
La prueba se desarrolla usando una Ё, una £, о el método de los intervalos de confianza. 
Si se usa la 7, se tiene que 


donde s es la raíz cuadrada del cuadrado medio del error y n = 6 es el tamaño de la 
muestra por tratamiento. En este caso, 


= 553.33 = 610.67 


4961/1/3 


= —1.41. 
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El valor P para la prueba т con 25 grados de libertad es 0.17. Así que по hay evidencia 
suficiente para rechazar Н. 


Relación entre T y F 


Anteriormente se expuso el uso de una prueba ѓ agrupada, junto con los lineamientos que 
se estudiaron en el capítulo 10. El estimado agrupado se tomó del cuadrado medio del 
error con el fin de aprovechar los grados de libertad que están agrupados en las cinco 
muestras. Además, probamos un contraste. El lector debería observar que si el valor t se 
eleva al cuadrado, el resultado tiene exactamente la misma forma que el valor de f para 
una prueba del contraste, analizada en la sección anterior. En efecto, 


(т. = 75.) _ (553.33 — 610.67)? 


Í = 20/64 1/6 4961(1/3) 


= 1.988, 
que es, por supuesto, £’. 


Método del intervalo de confianza para una comparación por pares 


Es fácil resolver el mismo problema de una comparación por pares (o un contraste) usando 
el método del intervalo de confianza. Es claro que, si se calcula un intervalo de confian- 
za del 100(1 – а)% sobre pu, — H, se tiene que 


2 
Jı. = Y5. + apse 


donde ż „ es el punto superior де 100(1 — @/2)% de una distribución / con 25 grados de 
libertad (grados de libertad que provienen de s?). Esta conexión inmediata entre las prue- 
bas de hipótesis y los intervalos de confianza debería ser evidente a partir de los análisis 
de los capítulos 9 y 10. La prueba de un contraste simple р, — Џи; no implica más que 
observar si el intervalo de confianza anterior cubre o no al cero. Al sustituir los números 
se tiene que el intervalo de confianza de 95%: 


1 
(553.33 —610.67) + 2.060 via | = —57.34 + 83.77. 


Por consiguiente, como el intervalo de confianza cubre al cero, el contraste no es signi- 
ficativo. En otras palabras, no hay diferencia significativa entre las medias de los agrega- 
dos 1 y 5. 


Tasa de error por experimento 


Se presentan muchas dificultades cuando el analista intenta hacer muchas o todas las 
comparaciones por pares posibles. Para el caso de k medias habrá, desde luego, r = 
k(k — 1)/2 comparaciones por pares posibles. Si se suponen comparaciones indepen- 
dientes, la tasa de error por experimento o tasa de error por familia, es decir, la probabi- 
lidad de un falso rechazo de al menos una de las hipótesis, es dada рог 1 — (1 ~ а)”, 
donde о еѕ la probabilidad seleccionada del error tipo I para una comparación específica. 
Es claro que esta medida del error tipo I por experimento sería bastante grande. Por 
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ejemplo, aun si sólo hubiera 6 comparaciones, digamos, en el caso de 4 medias, y 
а = 0.05, la tasa de experimento-juicio sería 


1 — (0.95) = 0.26. 


Cuando se prueban muchas comparaciones por pares, por lo general existe la necesi- 
dad de hacer el contraste efectivo sobre una sola comparación más conservadora. Es decir, 
usando el método del intervalo de confianza, los intervalos de confianza serían mucho 
más anchos que +1, 54/2 / п que se emplea рага el caso de una sola comparación. 


Prueba de Tukey 


Hay varios métodos estándar para realizar comparaciones por pares que den credibilidad 
a la tasa del error tipo 1. Aquí se analizarán e ilustrarán dos de ellos. El primero, denomi- 
nado procedimiento de Tukey, permite la formación de intervalos de confianza del 
100(1 — 0)% simultáneos para todas las comparaciones por pares. El método se basa en 
la distribución del rango estudentizado. El punto apropiado del percentil es una función 
de q, k y v = grados de libertad para s?. En la tabla A.12 se presenta una lista de puntos 
porcentuales superiores adecuados para œ = 0.05. El método de Tukey de comparacio- 
nes por pares implica encontrar una diferencia significativa entre las medias i y j (i F j) 


si |y, — У | excede а g(Q, k, v, ps 

El procedimiento de Tukey se ilustra con facilidad. Considere un ejemplo hipotético 
en el que se tienen 6 tratamientos en un diseño completamente aleatorizado de un 
solo factor, en el que se hacen 5 observaciones por tratamiento. Suponga que el cuadrado 
medio del error tomado de la tabla del análisis de varianza es s? = 2.45 (24 grados de 
libertad). Las medias muestrales están en orden ascendente, 

Ya, Js. yı. Уз. Y6. Ya. 
1450 16.75 19.84 21.12 22.90 23.20. 


Con & = 0.05, el valor de q(0.05, 6, 24) es 4.37. Así, todas las diferencias absolutas se 
comparan con 


4.37 e = 3.059. 


Como resultado, las siguientes representan medias que, usando el procedimiento de 
Tukey, se encuentra que son significativamente diferentes: 


4y1, 4y5, 4y2, буі, буз5, 
буз, 3у5, 3y2, 1у5, 1y2. 


¿De dónde proviene el nivel с en la prueba de Tukey? 


Se mencionó brevemente el concepto de intervalos de confianza simultáneos que se 
emplean para el procedimiento de Tukey. El lector obtendrá una perspectiva útil del 
concepto de comparaciones múltiples, si comprende el significado de los intervalos de 
confianza simultáneos. 

En el capítulo 9 vimos que, si se calcula un intervalo de confianza de 95% para, di- 
gamos, una media u, entonces la probabilidad de que el intervalo cubra la media verda- 
dera es 0.95. 
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Sin embargo, como vimos antes, para el caso de comparaciones múltiples la probabili- 
dad efectiva de interés está ligada con la tasa de error por experimento, y debe hacerse 
énfasis en que los intervalos de confianza del tipo y, — У, +g(a, К, v)s Jl/n no son in- 
dependientes, ya que todos implican a s y muchos utilizan los mismos promedios, las у. 
A pesar de tales dificultades, si se utiliza la 4(0.05, k, v), el nivel de confianza simultáneo 
está controlado en un 95%. Lo mismo es cierto para q(0.01, k, v), es decir, el nivel de 
confianza está controlado en un 99%. En el caso de @ = 0.05, hay una probabilidad 
de 0.05 de que se encuentre falsamente que al menos un par de mediciones son diferen- 
tes (falso rechazo de al menos una hipótesis nula). En el caso de œ = 0.01, la probabilidad 
correspondiente será 0.01. 


Prueba de Duncan 


El segundo procedimiento que se estudiará se denomina procedimiento de Duncan o 
prueba de Duncan de rango múltiple. Este procedimiento también se basa en el con- 
cepto general del rango estudentizado. El rango de cualquier subconjunto de p medias 
muestrales debe exceder cierto valor antes de que se encuentre que cualquiera de las p 
medias es diferente. Este valor recibe el nombre de rango de menor significancia para 
las p medias, y se denota por R» donde 


Los valores de la cantidad ro llamados rango estudentizado de menor significancia, 
dependen del nivel de significancia deseado y del número de grados de libertad del cuadra- 
do medio del error. Estos valores se obtienen de la tabla A.13 para р = 2, 3,..., 10 medias. 

Para ilustrar el procedimiento de prueba de rango múltiple, consideremos el ejem- 
plo hipotético en el cual se comparan 6 tratamientos con 5 observaciones por tratamiento. 
Se trata del mismo ejemplo que se empleó para ilustrar la prueba de Tukey. Se obtiene 
R, multiplicando cada r, por 0.70. Los resultados de estos cálculos se resumen como sigue: 


p| 2 3 4 5 6 


гр | 2.919 3.066 3160 3.226 3.276 
Rp | 2.043 2.146 2.212 2.258 2.293 


Si se comparan estos rangos de menor significancia con las diferencias en medias orde- 
nadas, se llega a las conclusiones siguientes: 
1. Como y, — y, = 8.70 > R, = 2.293, se concluye que ju, y p, son significativa- 
mente distintas. 


2. Si se comparan y, — y, y Y, — у, con R,, se concluye que yu, es significativa- 
mente mayor que y, y que pu, es significativamente mayor que р. 


3. Si se comparan y, — у, Ye, — Ys, Y Y, — Y, Con R,, se concluye que cada dife- 
rencia es significativa. 


4. Sise comparan у, — Уз, У, — У,у, — Ys уу, — Y, Con R,, se encuentra que 
todas las diferencias son significativas excepto рага џи, – ш. Por lo tanto, р, H, 
y Hi, constituyen un subconjunto de medias homogéneas. 

5. Si se comparan У» – уу, У z Js, y y, — y, con R, se concluye que sólo 4, y H, 
no son significativamente distintas. 
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Se acostumbra resumir las conclusiones anteriores con el dibujo de una línea debajo de 
cualquier subconjunto de medias adyacentes que no sean significativamente diferentes. 
Así, tenemos 
yi. Js. Ya. Уз. Jo. Ya. 
1450 16.75 1984 21.12 22.90 23.20 


Es evidente que en este caso los resultados con los procedimientos de Tukey y Duncan 
son muy similares. El procedimiento de Tukey no detectó ninguna diferencia entre 2 y 5; 
mientras que el de Duncan sí lo hizo. 


Prueba de Dunnett: comparación de tratamientos con un control 


En muchos problemas científicos y de ingeniería no nos interesa hacer inferencias acerca 
de todas las comparaciones posibles entre las medias de los tratamientos del tipo 4,— p, 
En vez de ello es frecuente que el experimento dicte la necesidad de comparar simultá- 
neamente cada tratamiento con un control. Un procedimiento de prueba desarrollado por 
C. W. Dunnett determina diferencias significativas entre cada media de tratamiento y el 
control, con un solo nivel conjunto de significancia œ. Para ilustrar el procedimiento de 
Dunnett, se considerarán los datos experimentales de la tabla 13.6 para la clasificación de un 
solo factor, donde se estudió el efecto de tres catalizadores sobre el producto de una reac- 
ción. Como control se emplea un cuarto tratamiento en el que no se aplica un catalizador. 


Tabla 13.6: Producto de una reacción 


Control Catalizador 1 Catalizador 2 Catalizador 3 


50.7 54.1 22,7 51.2 
51.5 53.8 53.9 50.8 
49.2 53.1 57.0 49.7 
53.1 22:5 54.1 48.0 
52.7 54.0 52.5 47.2 


Yo. = 51.44 ў = 53.50 ӱ› = 54.04 ӱз. = 49.38 


En general, se desea probar las k hipótesis 


Ho: Ho = Hi р 
AS 
H;: o кезу 


donde u, representa el producto medio para la población de medidas en que se utiliza el 
control. Como se mencionó en la sección 13.3, se espera que las suposiciones habituales 
del análisis de varianza sigan siendo válidas. Para probar la hipótesis nula especificada 
con A, en comparación con alternativas bilaterales para una situación experimental 
donde existen k tratamientos, sin incluir el control, y n observaciones por tratamiento, 
primero calculamos los valores 

ds E ф=1 о й 


\1/25°/п” 


Como antes, la varianza muestral s? se obtiene a partir del cuadrado medio del error еп 
el análisis de varianza. Ahora bien, la región crítica para rechazar H, a un nivel de signi- 
ficancia а, se establece con la desigualdad 


Ejercicios 
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|di| > daj2(k, v), 


donde v es el número de grados de libertad para el cuadrado medio del error. Los valores 
de la cantidad d „(К, v) para una prueba de dos colas se incluyen en la tabla A.14 para 
а = 0.05 уа = 0.01, para diversos valores de k y у. 


Ejemplo 13.5: | Para los datos de la tabla 13.6, pruebe la hipótesis que compara cada catalizador con 


Solución: 


el control, usando alternativas bilaterales. Como nivel de significancia conjunto elija 
а = 0.05. 

El cuadrado medio del error con 16 grados de libertad se obtiene de la tabla de análisis 
de varianza, usando todos los tratamientos k + 1. El cuadrado medio del error es dado 
por 


.812 
о _ 368 


2 
252 _ ү е вва 
n 


= 2.30075 y y 


Entonces, 
54.04 — 51.44 
0.9593 


a _ 53:50 51.44 
17 0.9593 

49.38 — 51.44 

de е = 
0.9593 


= 2.147, d, = = 2.710, 


= —2.147. 


De la tabla A.14 el valor crítico рага œ = 0.05 resulta ser а, ¿,,(3, 16) = 2.59. Como 
|d| < 2.59 y |d,| < 2.59, se concluye que tan sólo la producción media para el catali- 
zador 2 es significativamente diferente de la respuesta media de la reacción utilizando 
el control. 2 

Muchas aplicaciones prácticas imponen la necesidad de una prueba de una cola para 
comparar los tratamientos con un control. En efecto, cuando un farmacólogo está intere- 
sado en el efecto de varias dosis de un medicamento sobre el nivel del colesterol, y su 
control consiste en una dosis de cero, sería interesante determinar si cada dosis produce 
una reducción significativamente mayor que la del control. En la tabla A.15 se presentan 
los valores críticos de d (k, v) para alternativas unilaterales. 


Ejercicios 


13.12 Considere los datos del ejercicio de repaso 
13.45 de la página 555. Efectúe pruebas de significan- 
cia sobre los siguientes contrastes: 

a) B contra A, C y D; 

b) C contra A y D; 

c) A contra D. 


13.13 El propósito del estudio The Incorporation of 
a Chelating Agent into a Flame Retardant Finish of a 
Cotton Flannelette and the Evaluation of Selected Fa- 
bric Properties, llevado a cabo en Virginia Tech, fue 
evaluar el uso de un agente quelante como parte del 
acabado retardante del fuego de la franela de algodón, 
determinando sus efectos en la inflamabilidad des- 
pués de lavar la tela en condiciones específicas. Se pre- 


pararon dos baños, uno con celulosa de carboximetilo y 
otro sin ella. Se lavaron 12 piezas de tela 5 veces en el 
baño I, y otras 12 piezas se lavaron 10 veces en 
el baño I. Esto se repitió con 24 piezas adicionales de 
tela en el baño II. Después de los lavados se midieron 
las longitudes quemadas de la tela, así como los tiem- 
pos de combustión. Por conveniencia, definamos los 
siguientes tratamientos: 


Tratamiento 1: 5 lavados en el baño I, 
Tratamiento 2: 5 lavados en el baño II, 
Tratamiento 3: 10 lavados en el baño I, 


Tratamiento 4: 10 lavados en el baño П. 
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Los registros del tiempo de combustión, en segundos, 
son los siguientes: 


Tratamiento 

1 2 3 4 
13.7 6.2 27.2, 18.2 
23.0 5.4 16.8 8.8 
15.7 5.0 12.9 14.5 
25.5 4.4 14.9 14.7 
15.8 5.0 17.1 17.1 
14.8 3:3 13.0 13.9 
14.0 16.0 10.8 10.6 
29.4 275, 13.5 5.8 

9.7 1.6 25.5 7.3 
14.0 3.9 14.2 17.7 
12.3 2.5 27.4 18.3 
12.3 7.1 11.5 9.9 


a) Efectúe un análisis de varianza a un nivel de signi- 
ficancia de 0.01, y determine si hay diferencias 
significativas entre las medias de los tratamientos. 

b) Use contrastes de un solo grado de libertad con 
а = 0.01 para comparar el tiempo medio de com- 
bustión del tratamiento 1 en comparación con el 
tratamiento 2, y también del tratamiento 3 en com- 
paración con el 4. 

13.14 El Departamento de Alimentación y Nutrición 
Humana de Virginia Tech realizó el estudio Loss of Ni- 
trogen Through Sweat by Preadolescent Boys Consu- 
ming Three Levels of Dietary Protein para determinar la 
pérdida de nitrógeno por transpiración con varios niveles 
dietéticos de proteínas. En el experimento participaron 
12 hombres preadolescentes cuyas edades iban de 7 años 
8 meses a 9 años 8 meses, y a quienes de les calificó de 
clínicamente saludables. Cada muchacho estuvo sujeto a 
una de tres dietas controladas en las cuales consumía 29, 
54 u 84 gramos de proteínas por día. Los siguientes da- 
tos representan la pérdida de nitrógeno corporal por 
transpiración, en miligramos, recabados durante los dos 
días últimos del periodo de experimentación: 
Nivel de proteínas 


29 gramos  54gramos 84 gramos 
190 318 390 
266 295 321 
270 271 396 

438 399 
402 


a) Realice un análisis de varianza a un nivel de signi- 
ficancia de 0.05, para demostrar que las pérdidas 
medias de nitrógeno por transpiración son diferen- 
tes con los tres niveles de proteínas. 

b) Utilice una prueba de Tukey para determinar cuá- 
les niveles de proteínas difieren significativamente 
entre sí en la pérdida media de nitrógeno. 

13.15 Utilice la prueba de Tukey а un nivel de signi- 
ficancia de 0.05, para analizar las medias de las 5 mar- 
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cas diferentes de tabletas para el dolor de cabeza del 
ejercicio 13.2 de la página 518. 


13.16 бе realizó una investigación para determinar la 
fuente de reducción en el rendimiento de cierto produc- 
to químico. Se sabía que la pérdida en el rendimiento 
ocurría en el licor madre, es decir, el material elimina- 
do en la etapa de filtración. Se pensaba que mezclas 
distintas del material original podrían ocasionar reduc- 
ciones diferentes del rendimiento en la etapa de licor 
madre. A continuación se presentan los resultados de la 
reducción porcentual para tres lotes de cada una de 
cuatro mezclas seleccionadas con anterioridad. 
Mezcla 
1 2 3 4 


25.6 25.2 20.8 31.6 
243 28.6 267 29.8 
27.9 247 22.2 34.3 


a) Haga el análisis de varianza al nivel de significan- 
cia а = 0.05. 

b) Utilice la prueba de Duncan de rango múltiple 

para determinar cuáles mezclas difieren. 

с) Resuelva el inciso b usando la prueba de Tukey. 
13.17 En el estudio, denominado An Evaluation of 
the Removal Method for Estimating Benthic Popula- 
tions and Diversity, realizado por Virginia Tech en el 
río Jackson, se emplearon 5 procedimientos distintos 
de muestreo para determinar los conteos de especies. 
Se seleccionaron 20 muestras al azar y los 5 procedi- 
mientos de muestreo se repitieron 4 veces. Se registra- 
ron los siguientes conteos de especies: 

Procedimiento de muestreo 
Remoción del 


Dismi- De Hess sustrato de 

nución modificado Surber Kicknet Kicknet 
85 75 31 43 17 
55 45 20 21 10 
40 35 9 15 8 
TI 67 37 27 15 


a) ¿Hay alguna diferencia significativa en el conteo pro- 
medio de especies para los distintos procedimientos 
de muestreo? Use un valor P en su conclusión. 

b) Emplee una prueba de Tukey con œ = 0.05 para de- 
terminar cuáles procedimientos de muestreo difieren. 

13.18 Los siguientes datos son valores de presión 
(psi) en un resorte de torsión para valores distintos del 
ángulo entre las vueltas del resorte en posición libre. 
Ángulo 
67 [71 | 75 |79 |83 
83 | 84 | 86 87 | 89 | 90 
85 | 85 | 87 87 | 90 | 92 


Ejercicios 


Calcule un análisis de varianza de un solo factor para 
este experimento y plantee sus conclusiones acerca del 
efecto que tiene el ángulo sobre la presión en el resorte. 
(Tomado de C. R. Hicks, Fundamental Concepts in the 
Design of Experiments, Holt, Rinehart y Winston, Nue- 
va York, 1973). 


13.19 Se sospecha que la temperatura del ambiente 
en que se activan las baterías afecta su vida. Se proba- 
ron 30 baterías homogéneas, seis a cada una de cinco 
temperaturas, y los datos se presentan a continuación 
(vida activada en segundos). Analice e interprete los 
datos. (Tomado de С. К. Hicks, Fundamental Concepts 
in Design of Experiments, Holt, Rinehart y Winston, 
Nueva York, 1973.) 
Temperatura(*C) 
0 25 50 75 


13.20 La tabla siguiente (tomada de A. Hald, Statisti- 
cal Theory with Engineering Applications, John Wiley 
& Sons, Nueva York, 1952) proporciona las resistencias 
а la tensión (en desviaciones desde 340) para conducto- 
res extraídos de nueve cables que deben usarse para 
una red de alto voltaje. Cada cable está constituido por 
12 conductores. Se desea saber si las resistencias me- 
dias de los conductores en los nueve cables son las mis- 
mas. Si los cables son diferentes, ¿cuáles son los que 
difieren? Utilice un valor P en su análisis de varianza. 


Cable Resistencia a la tensión 
1 5—13 5 2—10 6 5 0-3 2 7 5 
2 11—13 8 8 3 -12 -12 -10 5—6—12—10 
3 0 —10 —15 —12 2 8 5 0-4 –1 5—11 
4 —12 4 2 10 5 8 —12 0—5 -3 3 0 
5 7 1 5 0 10 6 5 2 0-1-10 -2 
6 1 0 —5 -4 —1 0 2 5 1-2 6 7 
7 —1 0 2 1 —4 2 T 5 1 0 —4 2 
8 —1 0 7 5 10 8 1 2—3 6 0 5 
9 2 6 7 8 15 11 -7 710 7 8 1 


13.21 La salida de resultados que se presenta en la 
figura 13.5 de la página 532 proporciona información 
sobre la prueba de Duncan para los datos de los agrega- 
dos del ejemplo 13.1 obtenidos con la función PROC 
GLM del programa SAS. Saque conclusiones sobre las 
comparaciones por pares usando los resultados de la 
prueba de Duncan. 


13.22 Realice la prueba de Duncan para comparacio- 
nes por pares con los datos del ejercicio 13.6 de la pá- 
gina 519. Comente los resultados. 
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13.23 En un experimento biológico se emplearon 4 
concentraciones de cierto producto químico para mejo- 
rar el crecimiento de cierto tipo de planta con el paso 
del tiempo. Se utilizaron cinco plantas con cada con- 
centración y se midió su crecimiento, en centímetros. 
Se obtuvieron los siguientes datos y también se aplicó 
un control (ausencia de producto químico) 


Concentración 
Control 1 2 3 4 
6.8 82 77 69 5.9 
7.3 87 84 5.8 6.1 
6.3 94 86 7.2 6.9 
6.9 92 81 68 57 
7.1 86 80 74 6.1 


Utilice una prueba bilateral de Dunnett a un nivel de 
significancia de 0.05 para comparar de manera simultá- 
nea las concentraciones con el control. 


13.24 La estructura financiera de una empresa con- 
siste en la forma en que sus activos se dividen en ca- 
pital y deuda, y el apalancamiento financiero se refiere 
al porcentaje de activos financiados con endeuda- 
miento. En el artículo The Effect of Financial Levera- 
ge on Return, Tai Ma, de Virginia Tech, afirma que es 
posible utilizar el apalancamiento financiero para in- 
crementar la tasa de rendimiento sobre el capital. Di- 
cho de otra manera, los accionistas pueden recibir 
rendimientos más elevados sobre el capital propio con 
la misma cantidad de inversión si usan apalancamien- 
to financiero. Los siguientes datos muestran las tasas 
de rendimiento sobre el capital utilizando 3 niveles 
distintos de apalancamiento financiero, así como un 
nivel de control (deuda igual a cero) para 24 empresas 
seleccionadas al azar. 


Apalancamiento financiero 


Control Bajo Medio Alto 
2.1 6.2 9.6 10.3 
5.6 4.0 8.0 6.9 
3.0 8.4 5.5 7.8 
7.8 2.8 12.6 5.8 
5.2 4.2 7.0 7.2 
2.6 5.0 7.8 12.0 


Fuente: Standard & Poor's Machinery Industry 
Survey, 1975. 


a) Haga el análisis de varianza a un nivel de signifi- 
cancia de 0.05. 

b) Use una prueba de Dunnett a un nivel de signifi- 
cancia de 0.01, para determinar si las tasas medias 
de rendimiento sobre el capital son más elevadas 
con los niveles bajo, medio y alto de apalanca- 
miento financiero que con el nivel de control. 
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The GLM Procedure 
Duncan's Multiple Range Test for moisture 
NOTE: This test controls the Type Т comparisonwise error rate, 


not the experimentwise error rate. 


Alpha 0.05 

Error Degrees of Freedom 25 

Error Mean Square 4960.813 
Number of Means 2 3 4 5 
Critical Range 83.75 87.97 90.69 92.61 


Means with the same letter are not significantly different. 


Duncan Grouping Mean N aggregate 
A 610.67 6 Б 
А 
А 610.50 6 3 
A 
A 569.33 6 2 
A 
A 553.33 6 1 
В 465.17 6 4 


Figura 13.5: Salida de resultados del SAS рага el ejercicio 13.21. 


13.7 Comparación de un conjunto de tratamientos en bloques 


En la sección 13.2 estudiamos la idea de la formación de bloques, es decir, de aislar 
conjuntos de unidades experimentales que son razonablemente homogéneas y asignarles 
tratamientos de forma aleatoria. Ésta es una extensión del concepto de “formar pares” 
que se analizó en los capítulos 9 y 10, y se hace para reducir el error experimental, ya que 
las unidades en un bloque tienen más características comunes que las unidades localiza- 
das en diferentes bloques. 

El lector no debería considerar los bloques como un segundo factor, aunque ésa 
sea una forma tentadora de visualizar el diseño. De hecho, el factor principal (los trata- 
mientos) aún lleva el peso mayor del experimento. Las unidades experimentales siguen 
siendo la fuente del error, igual que en el diseño completamente aleatorizado. Con la 
formación de bloques simplemente tratamos a dichas unidades de manera más sistemáti- 
ca. De ese modo, se dice que la aleatoriedad tiene restricciones. Antes de iniciar el estudio 
de la formación de bloques revisaremos dos ejemplos de un diseño completamente 
aleatorizado. El primer ejemplo es un experimento químico diseñado para determinar si 
hay una diferencia en la reacción media producida por cuatro catalizadores. Las mues- 
tras de los materiales que tienen que probarse se extraen de los mismos lotes de materias 
primas, a la vez que se mantienen constantes otras condiciones como la temperatura y 
concentración de los reactivos. En este caso, la hora del día en que se efectúan las corridas 
experimentales podría representar las unidades experimentales, y si el experimentador 
considera que es posible que haya un ligero efecto del tiempo, aleatorizaría la asignación 
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de los catalizadores a las corridas para contrarrestar la posible tendencia. Como un se- 
gundo ejemplo de dicho diseño, considere un experimento para comparar cuatro méto- 
dos para medir una propiedad física en particular de un fluido. Suponga que el proceso 
de muestreo es destructivo, es decir, que una vez que se ha medido una muestra de la 
sustancia usando un método, ya no puede medirse nuevamente con ningún otro. Si se 
decide hacer cinco mediciones con cada método, entonces se seleccionan al azar 
20 muestras del material de un lote grande y se utilizan en el experimento para comparar 
los cuatro métodos de medición. Las unidades experimentales son las muestras seleccio- 
nadas al azar. Cualquier variación de una muestra a otra aparecerá en la variación del 
error, según se mida con s? en el análisis. 


¿Cuál es el propósito de formar bloques? 


Si la variación debida a la heterogeneidad en las unidades experimentales es tan grande 
que la sensibilidad para detectar diferencias de tratamiento se reduce debido a un valor 
aumentado de s?, un plan mejor sería “bloquear” la variación debida a esas unidades y, 
por consiguiente, reducir la variación ajena a la que es explicada por bloques más peque- 
ños o más homogéneos. Por ejemplo, suponga que en el ejemplo anterior de los cataliza- 
dores se supiera a priori que existe en definitiva un efecto significativo diario sobre el 
producto, y que es posible medir el producto para cuatro catalizadores en un día especí- 
fico. En lugar de asignar los 4 catalizadores a las 20 corridas de prueba completamente 
al azar, se eligen, por ejemplo, 5 días y se prueba cada uno de los cuatro catalizadores 
cada día, asignándolos al azar a las corridas dentro de los días. De esta manera se elimina 
la variación diaria del análisis y, en consecuencia, el error experimental, que aún incluye 
cualquier tendencia temporal dentro de los días, representa con más precisión la varia- 
ción aleatoria. A cada día se le denomina bloque. 

El más directo de los diseños aleatorizados de bloques es aquel en el cual se asigna 
al azar un tratamiento a la vez a cada bloque. A un plan experimental como éste se le 
denomina diseño de bloques completos aleatorizados (BCA) y cada bloque constituye 
una sola réplica de los tratamientos. 


13.8 Diseños de bloques completos aleatorizados 


Un plan clásico para el diseño de bloques completos aleatorizados (BCA) usando tres 
mediciones en cuatro bloques es el siguiente: 


Bloque 1 Bloque 2 Bloque 3 Bloque 4 
to + Їз ta 
t4 t3 12 11 
ta to t4 t3 


Las £ denotan la asignación de cada uno de 3 tratamientos a los bloques. Desde luego, la 
asignación verdadera de los tratamientos a las unidades dentro de los bloques se hace 
al azar. Una vez que ha finalizado el experimento, los datos se pueden registrar como en el 
siguiente arreglo de 3 x 4: 
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Tratamiento Bloque: 1 2 3 4 


1 Уп Уо Уз Уш 
2 Ул Уә Уз Уэл 
3 Узі Уз2 Узз Узал 


donde y,, representa la respuesta que se obtiene al utilizar el tratamiento 1 en el bloque 1, 
y, es la respuesta que se obtiene al utilizar el tratamiento 1 en el bloque 2,..., y y}, es la 
respuesta que se obtiene al utilizar el tratamiento 3 en el bloque 4. 

Ahora vamos a generalizar y a considerar el caso de k tratamientos asignados a 
b bloques. Los datos se pueden resumir tal como se observa en el arreglo rectangular de 
k x b de la tabla 13.7. Se supondrá que las Yi i = 1, 2,..., k y j = 1,2,..., b, son valores 
de variables aleatorias independientes que tienen distribuciones normales con media A, 
y varianza común 07. 


Tabla 13.7: Arreglo de k x b para el diseño de ВСА 


Bloque 
Tratamiento 1 2. ми. J Di b Тоа Media 
1 Yu Ую > Уу +: УЬ Ti, yı. 
2 уз yz .. Yj .. у» П. Ya. 
i Yi Yiz +. уу + уь T; Ji. 
k ук Укэ .. Уй =- Уу Tk Yk. 
Total Т | Тә Т.) Saro Tp T; 
Media Ya Ya «s Yj >- Yæ J: 


Sea u, el promedio (en lugar del total) de las b medias de la población para el 
i-ésimo tratamiento. Es decir, 


b 
1 f 
Hi. = ¿2 a A A 


De manera similar, el promedio de las medias de la población para el j-ésimo bloque, H; 
es definido por 


k 
1 
Шу = рд Hij, para j = 1,...,b 


i=1 


y el promedio de las bk medias de la población, u, es definido por 


Para determinar si parte de la variación de nuestras observaciones se debe a diferencias 
entre los tratamientos, se considera la siguiente prueba: 
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Hipótesis de Ho ne — 
medias iguales AA Б 


de los tratamientos Ні: No todas las и; son iguales. 


Modelo para el diseño ВСА 


Cada observación se puede escribir en la forma siguiente: 
уу = Шу + є 


donde €, mide la desviación del valor observado Y; de la media de la población Ш, Га 
forma preferida de esta ecuación se obtiene sustituyendo 


ij =н + Qi + 8, 


donde q, es, como antes, el efecto del i-ésimo tratamiento, y В, es el efecto del ¡-ésimo 
bloque. Se supone que el tratamiento y los efectos de los bloques son aditivos. Por lo 
tanto, se puede escribir 


уу = И + О +8; + є. 


Observe que el modelo se parece al de clasificación de un solo factor; la diferencia esen- 
cial es la introducción del efecto de bloque В. El concepto básico se parece mucho al de 
la clasificación de un solo factor, excepto que en el análisis debe tomarse en cuenta el 
efecto adicional debido a los bloques, ya que ahora la variación se controla de manera 
sistemática en dos direcciones. Si ahora imponemos las restricciones de que 


k b 
20o=0 y »4=0 
i=l j=1 

entonces 


b 
1 А 
ш = т у (и + о + 8) = р + ах, рагаі = 1,..., К, 


j=l 


k 
1 , 
ш = т + a +) = р +8, ратај= 1,...,Ь. 


i=l 


La hipótesis пша de que las k medias de los tratamientos 4, son iguales y, por lo tanto, 
iguales a p, ahora es equivalente a probar la hipótesis: 


Ho: Qi = Q2 = ··.. = Qk =0, 


H: Al menos una de las q, no es igual а сего. 


Cada una de las pruebas de tratamientos se basará en una comparación de los 
estimados independientes de la varianza común poblacional о?. Esos estimados se 
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obtendrán separando la suma total de cuadrados de los datos en tres componentes me- 
diante la siguiente identidad: 


Teorema 13.3: Identidad de la suma de cuadrados 


[4 b k b 
ИЕС. 
i=l 


ї=1 ¡=1 j=l 


k b 
E a 


i=l ј=1 


La demostración se deja como ejercicio para el lector. 


La identidad de la suma de cuadrados podría presentarse simbólicamente mediante la 


ecuación 
STC = SCT + SCB + SCE, 
donde 
k b 
STC = NE Уо» =} = suma total de cuadrados, 
i=l ј=1 
k 
SCENES b» O: = y = suma de los cuadrados de los tratamientos, 
i=l 
b 
СВЕ УФ, —ў. ye = suma de los cuadrados de los bloques, 


g= 


k b 
SCE = 55, Yo =й 000 e, )? = suma de los cuadrados del error. 
i=l ¡=1 


Si se sigue el procedimiento descrito en el teorema 13.2, donde se interpretó a las 
sumas de cuadrados como funciones de las variables aleatorias independientes, Y р 
ҮҮ Se puede demostrar que los valores esperados de las sumas de los cuadrados 
de los tratamientos, los bloques y los errores son dados por 


k b 
E(SCT) =(k-D)0?+bY 02, E(SCB)=(b-1)0?4+k) 8), 
і=1 j=1 


E (SCE) = (b — 1)(к — Do?. 


Como en el caso del problema de un solo factor, tenemos que el cuadrado medio del 
tratamiento es 


SCT 


2 
$ 
LU k=l 


Si los efectos del tratamiento 0)=0,=""=0Q,= 0, entonces s? es un estimado inses- 
gado de o°. Sin embargo, si los efectos de los tratamientos no son todos iguales а cero, 
se tiene que: 
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Media cuadrada 
esperada 
del tratamiento 


К 
СИ 2, b Р 
E (27) =g tpe“ 


En este caso s? sobrestima 02. Un segundo estimado de @?, basado en b — 1 grados de 
libertad, es 


a SCB 
55 = bai 


El estimado s} es un estimado no sesgado de о? si los efectos de los bloques B, =,= 
++ = B, = 0. 51 los efectos de los bloques no son iguales a cero, entonces, 


SCB м 0 , 
ca). + Er 


y s sobrestimará a о?. Un tercer estimado de o°, basado en (k – 1)(b — 1) grados de li- 
bertad e independiente de s? y 52, es 


‚_ СЕ 
=D 


que es no sesgado independientemente de la veracidad o falsedad de cualquier hipótesis 
nula. 

Para probar la hipótesis nula de que los efectos de los tratamientos son iguales a 
cero, se calcula la razón f, = s /5?, que es un valor de la variable aleatoria F,, que tiene 
una distribución F соп k — 1 y (k – 1)(b — 1) grados de libertad, cuando la hipótesis nula 
es verdadera. La hipótesis nula se rechaza al nivel de significancia Y cuando 


Л > falk — 1, (k — 1)(b — 1)]. 


En la práctica, primero calculamos STC, SCT y SCB, y después, utilizando la identi- 
dad de la suma de cuadrados, obtenemos SCE mediante una resta. Los grados de libertad 
asociados con SCE por lo general también se obtienen por sustracción; es decir, 


(= Бу ее (Е реф); 


Los cálculos necesarios рага un problema de análisis de varianza para un diseño de 
bloques completos aleatorizados se puede resumir como se observa en la tabla 13.8. 


Ejemplo 13.6: | Se consideran cuatro máquinas diferentes, М, M, M, y M, para ensamblar un produc- 


to específico. Se decidió que para comparar las máquinas se usarían 6 operadores 
distintos en un experimento de bloques aleatorizados. Las máquinas se asignaron al 
azar a cada operador. La operación de las máquinas requiere destreza física, y se anti- 
cipó que habría una diferencia en la velocidad con que los operadores trabajaban con 
las máquinas. En la tabla 13.9 se observan los tiempos (en segundos) requeridos para 
ensamblar el producto. 

A un nivel de significancia de 0.05, pruebe la hipótesis H, de que las máquinas se 
desempeñan con el mismo índice de velocidad promedio. 
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Tabla 13.8: Análisis de varianza para el diseño de bloques completos aleatorizados 


Fuente de Suma de Grados de Cuadrado / 
variación cuadrados libertad medio calculada 
T 2 
Tratamientos SCT k=1 57 = pao fi = ш 
к—1 52 
SCB 
Bloques SCB b=1 ве pi 
SCE 
E E k—1)(b-1 мех =. 
rror SC. ( )›( ) s = 060 
Total STC kb —1 


Tabla 13.9: Tiempo para ensamblar el producto, en segundos 


Operador 
Máquina 1 2 3 4 5 6 Total 
1 425 393 396 399 429 436 247.8 
2 39.8 401 405 423 425 43.1 248.3 
3 402 405 413 434 449 45.1 255.4 
4 413 422 435 442 459 423 259.4 
Total 163.8 162.1 1649 169.8 176.2 174.1 1010.9 


Solución: Las hipótesis son 


Ho: 


оу = Q2 = Оз = Q4 = 0 (los efectos de las máquinas son iguales а cero), 


H: Al menos una de las о no es igual a cero. 


Para producir el análisis de varianza que aparece en la tabla 13.10 se emplean las 
fórmulas de la suma de cuadrados que se presentan en la página 536 y los grados de li- 
bertad. El valor f = 3.34 es significativo con Р = 0.048. Si se emplea а = 0.05 como al 
menos una aproximación burda, se concluye que las máquinas no se desempeñan con el 
mismo índice de velocidad media. 


JJ 


Tabla 13.10: Análisis de varianza para los datos de la tabla 13.9 


Fuente de Ѕита іе Grados de Cuadrado f 
variación cuadrados libertad medio calculada 
Máquinas 15.93 3 5.31 3.34 
Operadores 42.09 5 8.42 

Error 23.84 15 1.59 

Total 81.86 23 


Comentarios adicionales acerca de la formación de bloques 


En el capítulo 10 presentamos un procedimiento para comparar medias cuando las ob- 
servaciones estaban ordenadas por pares. El procedimiento implicaba “restar” el efecto 
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debido a la paridad homogénea para así trabajar con las diferencias. Este es un caso 
especial de diseño de bloques completos aleatorizados con k = 2 tratamientos. Las n 
unidades homogéneas a las que se asignaron los tratamientos adoptan el papel de bloques. 

Si hay heterogeneidad en las unidades experimentales, el experimentador no debe- 
ría confundirse y pensar que siempre es ventajoso reducir el error experimental mediante 
el uso de pequeños bloques homogéneos. De hecho podría haber casos en los que no es 
deseable formar bloques. El propósito de reducir la varianza del error es incrementar la 
sensibilidad de la prueba para detectar diferencias en las medias de los tratamientos. 
Esto se refleja en la potencia del procedimiento de prueba. (En la sección 13.11 se ana- 
liza con mayor detalle la potencia del procedimiento de prueba del análisis de varian- 
za). La potencia para detectar ciertas diferencias entre las medias de los tratamientos se 
incrementa con una disminución de la varianza del error. Sin embargo, la potencia tam- 
bién se ve afectada por los grados de libertad con los que se estima la varianza, y la 
formación de bloques reduce los grados de libertad que están disponibles desde k(b — 1) 
para la clasificación de un solo factor, hasta (k – 1)(b — 1). De modo que se podría per- 
der potencia con la formación de bloques si no hay una reducción significativa de la 
varianza del error. 


Interacción entre bloques y tratamientos 


Otra suposición importante que está implícita en la escritura del modelo para un diseño 
de bloques completos aleatorizados es que los efectos de los bloques y del tratamiento 
son aditivos. Esto equivale a decir que 


Шу = pijo = Шу = Шу, ойе Шу — pij = pijo — Hij’ 


рага cada valor de i, i’, j y j’. Es decir, la diferencia entre las medias de la población para 
los bloques j y /'еѕ la misma para cada tratamiento, у la diferencia entre las medias de la 
población para los tratamientos i e ¡“es la misma para cada bloque. Las líneas paralelas 
de la figura 13.6a ilustran un conjunto de respuestas medias para las cuales los efectos de 
los tratamientos y los bloques son aditivos, mientras que las líneas que se intersecan 
en la figura 13.6b exhiben una situación en la que se dice que los efectos de los trata- 
mientos y de los bloques interactúan. Con respecto al ejemplo 13.6, si el operador 3 
es en promedio 0.5 segundos más rápido que el operador 2 cuando utiliza la máquina 1, 
entonces el operador 3 será 0.5 segundos más rápido, en promedio, que el operador 2 
cuando se empleen las máquinas 2, 3 o 4. En muchos experimentos no se cumple la 
suposición de aditividad y el análisis descrito en esta sección llevaría a conclusiones 
erróneas. Por ejemplo, suponga que el operador 3 es 0.5 segundos más rápido, en prome- 
dio, que el operador 2 si emplea la máquina 1, pero que es 0.2 segundos más lento, en 
promedio, que el operador 2 si utiliza la máquina 2. En ese caso los operadores y las 
máquinas estarían interactuando. 

Una inspección de la tabla 13.9 sugiere la posible presencia de interacción. Esta 
aparente interacción podría ser real o podría deberse al error experimental. El análisis del 
ejemplo 13.6 se basó en la suposición de que la aparente interacción se debe por comple- 
to al error experimental. Si la variabilidad total de nuestros datos se debiera en parte al 
efecto de la interacción, esa fuente de variación seguiría formando parte de la suma de 
cuadrados del error, provocando que el cuadrado medio del error sobrestime a o°, 
incrementando así la probabilidad de cometer un error tipo П. De hecho, hemos supuesto 
un modelo incorrecto. Si permitimos que (08), denote el efecto de Іа interacción del 
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Figura 13.6: Medias de la población para a) resultados aditivos y b) efectos de 
interacción. 


¡-ésimo tratamiento y el j-ésimo bloque, podríamos escribir un modelo más adecuado 
con la forma siguiente: 


уй = 4405 +68; + (08); + є, 


al que se impondrían las restricciones adicionales 


k b 
У (08); = У (08); = 0, parai = 1,...,k y j=1,...,b. 


i=l j=1 
Ahora es fácil comprobar que 


k 


SCE ШИГ 1 2 А 
E a 1)(k — 5 Tá (b—1)(k — 1) 220900 


Así, el cuadrado medio del error es considerado un estimado sesgado de о? cuando se 
ha ignorado la interacción existente. En este momento parecería necesario utilizar un 
procedimiento para detectar la interacción en aquellos casos en que se sospecha que 
exista. Tal procedimiento requiere que se disponga de un estimado no sesgado e inde- 
pendiente de о?. Por desgracia, el diseño de bloques aleatorizados no se presta a una 
prueba de este tipo, a menos que se modifique el diseño inicial del experimento. En el 
capítulo 14 se estudia este tema de manera detallada. 


Métodos gráficos y verificación del modelo 


En varios capítulos de este libro se hace referencia a procedimientos gráficos para mos- 
trar datos y resultados analíticos. En los primeros capítulos se usaron gráficas de tallo y 
hojas y de caja y extensión como auxiliares visuales para resumir muestras. En el capí- 
tulo 10 se emplearon diagnósticos similares para entender mejor los datos de dos proble- 
mas de muestreo. En el capítulo 11 se introdujo el concepto de gráfica de residuales para 
detectar violaciones de las suposiciones estándar. En los últimos años gran parte de la 
atención dedicada al análisis de datos se ha centrado en los métodos gráficos. Al igual 
que en la regresión, el análisis de varianza se presta a la elaboración de gráficas que 
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ayudan a resumir los datos y a detectar violaciones. Por ejemplo, una gráfica sencilla de 
las observaciones brutas alrededor de la media de cada tratamiento proporciona al ana- 
lista una noción de la variabilidad entre las medias muestrales y dentro de las muestras. 
La figura 13.7 ilustra una de tales gráficas para los datos de agregados que se presentan 
en la tabla 13.1. A partir de la apariencia de la gráfica se obtiene incluso una idea de 
cuáles agregados (si los hubiera) destacan de los demás. Es evidente que el agregado 4 
resalta del resto, y que los agregados 3 y 5 forman un grupo homogéneo, así como los 
agregados l y 2. 
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Figura 13.7: Gráfica de los datos alrededor de la Figura 13.8: Gráfica de los residuales para cinco 


media para los datos de los agregados de la tabla 13.1. agregados con los datos de la tabla 13.1. 


Como ocurre en el caso de la regresión, los residuales son útiles en el análisis de 
varianza para dar un diagnóstico sobre la detección de violaciones de los supuestos. Para 
formar los residuales sólo necesitamos considerar el modelo del problema de un solo 
factor, que es 


уу = Hi + €j. 


Es fácil determinar que el estimado de p, es y. Por lo tanto, el ¿j-ésimo residual es Y; — Y 
lo cual se extiende fácilmente al modelo de bloques completos aleatorizados. Sería alec- 
cionador graficar los residuos para cada agregado con el fin de obtener cierta información 
sobre la suposición de varianza homogénea. Esta gráfica se muestra en la figura 13.8. 

Las tendencias en gráficas como éstas podrían revelar dificultades en ciertas situa- 
ciones, especialmente cuando la violación de una suposición en particular se manifiesta 
en la gráfica. En el caso de la figura 13.8, los residuales parecen indicar que las varian- 
zas dentro de los tratamientos son razonablemente homogéneas, excepto la del agrega- 
do 1. Hay cierta evidencia gráfica de que la varianza del agregado 1 es más grande que 
la del resto. 


¿Qué es un residual para un diseño de BCA? 


El diseño de bloques completos aleatorizados es otra situación experimental en la cual 
una gráfica permite que el analista se sienta cómodo con una “imagen ideal” o que tal 
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vez detecte dificultades. Recuerde que el modelo para el diseño de bloques completos 
aleatorizados es 


Уй = + о + 8; + є, i= like j=1,...,b, 


con las restricciones impuestas 


Para determinar qué es lo que en realidad constituye un residual considere que 
== Вещи 


y que и se estima por medio de y.., и, se estima por medio de y, y p,se estima por medio 
de y, Como resultado, el valor ajustado о pronosticado Уу, es dado рог 


ў =Â ++б6 +8 = Yi + Y —).> 
y, entonces, el residual en la observación (i, j) es dado por 
Vi di =D Ye =ўу+ у» 


Observe que у, , el valor ajustado, es un estimado de la media и. Esto es congruente con 
la partición de la variabilidad dada en el teorema 13.3, en la que la suma de los cuadrados 
del error es 


k 


b 
5СЕ =`у X (у =: =y] +5... 
i j 


Las técnicas visuales para el diseño de bloques completos aleatorizados requieren 
que se grafiquen los residuos por separado para cada tratamiento y cada bloque. Si la 
suposición de varianza homogénea se cumple, el analista debería esperar una variabili- 
dad aproximadamente igual. El lector seguramente recordará que en el capítulo 12 se 
estudiaron gráficas de los residuales con el objetivo de detectar si el modelo era inade- 
cuado. En el caso del diseño de bloques completos aleatorizados, una grave falla del 
modelo podría estar relacionada con la suposición de aditividad (lo cual significa que no 
hay interacción). Si no hay interacción debe surgir un patrón aleatorio. 

Considere los datos del ejemplo 13.6, donde los tratamientos son cuatro máqui- 
nas y los bloques son seis operadores. Las figuras 13.9 y 13.10 incluyen las gráficas 
de los residuales para tratamientos separados y bloques separados. La figura 13.11 
presenta una gráfica de los residuales contra los valores ajustados. La figura 13.9 re- 
vela que quizá la varianza del error no sea la misma para todas las máquinas, y lo 
mismo podría ocurrir con la varianza del error para cada uno de los seis operadores. 
Sin embargo, al parecer dos residuales inusualmente grandes son los que provocan la 
aparente dificultad. La figura 13.11 es una gráfica de residuales que revela evidencia 
razonable de un comportamiento aleatorio. Sin embargo, sobresalen los dos residuales 
grandes ya detectados. 
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Figura 13.11: Residuales graficados contra los valores ajustados para los datos del 
ejemplo 13.6. 


13.10 Transformaciones de datos en el análisis de varianza 


En el capítulo 11 se puso mucha atención a la transformación de la respuesta y en situa- 
ciones para las que se ajustaba un modelo de regresión lineal a un conjunto de datos. Es 
evidente que se aplican los mismos conceptos a la regresión lineal múltiple, aunque 
esto no se analizó en el capítulo 12. En el estudio de los modelos de regresión se hizo 
énfasis en las transformaciones de y que producirían un modelo que se ajustara mejor a 
los datos que uno en el que la y ingresara de forma lineal. Por ejemplo, si la estructura 
del “tiempo” es de naturaleza exponencial, entonces una transformación logarítmica de 
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y linealiza la estructura y, por lo tanto, se anticipa más éxito cuando se utiliza la res- 
puesta transformada. 

Aunque el propósito fundamental de la transformación de datos que se ha analiza- 
do hasta este momento ha sido mejorar el ajuste del modelo, hay otras razones para 
transformar o reexpresar la respuesta y, y muchas de ellas se relacionan con las suposi- 
ciones que se hacen, por ejemplo, las suposiciones de las cuales depende la validez del 
análisis. Una suposición muy importante en el análisis de varianza es la de la varianza 
homogénea que se estudió antes en la sección 13.4. Se supone una varianza común 0°. 
Si la varianza difiere mucho de un tratamiento a otro, y se realiza el ANOVA estándar 
que se estudia en este capítulo (y en otros posteriores), los resultados serían muy defi- 
cientes. En otras palabras, el análisis de varianza no es robusto respecto a la suposición 
de varianza homogénea. Como se ha dicho hasta el momento, se trata del motivo prin- 
cipal para la graficación de los residuales que estudiamos en la sección anterior y que 
ilustramos en las figuras 13.9, 13.10 y 13.11. Esas gráficas permiten detectar problemas 
debidos a una varianza no homogénea. Sin embargo, ¿qué hay que hacer al respecto? 
¿Cómo se corrigen? 


¿De dónde proviene la varianza no homogénea? 


Con frecuencia, aunque no siempre, la varianza no homogénea en el ANOVA existe 
debido a la distribución de las respuestas. Ahora, por supuesto, se supone la normalidad de 
la respuesta, pero hay ciertas situaciones en las que se necesitan pruebas de las medias 
aunque la distribución de la respuesta sea una de las distribuciones no normales que se 
estudiaron en los capítulos 5 y 6, es decir, la distribución de Poisson, la logarítmica nor- 
mal, la exponencial y la gamma. Realmente existen problemas del tipo del ANOVA con 
datos de conteo, duración antes de la falla, etcétera. 

En los capítulos 5 y 6 se demostró que, además del caso de la normal, la varianza de 
una distribución con frecuencia será función de la media, es decir, o? = g(u,). Por ejem- 
plo, en el caso de la distribución de Poisson, Var(Y) = ци, = ©}, lo que significa que la 
varianza es igual a la media. En el caso de la distribución exponencial, Var(Y) = g = 
u?, o sea que la varianza es igual al cuadrado de la media. Para el caso de la logarítmica 
normal, una transformación logarítmica produce una distribución normal con varianza 
constante g”. 

Los mismos conceptos que usamos en el capítulo 4 para determinar la varianza de 
una función no lineal pueden ayudarnos a determinar la naturaleza de la transformación 
estabilizadora de la varianza g(y). Recuerde la expansión de las series de Taylor de 
agyi) 

ду; 
de transformación g(y) debe ser independiente de u para que baste como la transforma- 
ción estabilizadora de la varianza. De lo anterior 


Маг[в(у:)] = [e (ua? o. 


primer orden de g(y,) alrededor de y, = u, donde gu) = | | . La función 
у= pi 


Como resultado, g(y,) debe ser tal que g'(p;) ос}. Así, si se sospecha que la res- 
puesta tiene una distribución de Poisson, 0; = ш / R de modo que g'(1,) сс 1. Enton- 
ces, la transformación estabilizadora de la varianza es g(y;) = у! А partir de esta 


ilustración y manipulaciones similares para las distribuciones exponencial y gamma, se 
obtiene lo siguiente. 
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во) = у!/? 
50у) = In y 
20) = In y 


Ejercicios 
Poisson 
Exponencial 
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Ejercicios 


13.25 Se utilizaron cuatro clases de fertilizante Íi Р, 
Л, y f, para estudiar la cosecha de frijol. El suelo se di- 
vidió en 3 bloques, cada uno de los cuales contiene 4 
parcelas homogéneas. A continuación se presentan las 
cosechas en kilogramos por parcela, así como los trata- 
mientos correspondientes: 


Bloque 1 Bloque 2 Bloque 3 
Л = 427 Л = 50.9 fa = 51.1 
fs = 48.5 Л = 50.0 f2 = 46.3 
Ја = 32.8 f2 = 38.0 fi =519 
fa = 39.3 fa = 40.2 fs = 53.5 


Realice un análisis de varianza a un nivel de significan- 
cia de 0.05 utilizando el modelo de bloques completos 
aleatorizados. 

13.26 Se compararon las cosechas de tres variedades 
de papas. El experimento se efectuó asignando cada 
variedad de manera aleatoria a 3 parcelas del mismo 
tamaño, en 4 lugares diferentes. Se registraron las si- 
guientes cosechas para las variedades A, B y C, en 100 
kilogramos por parcela: 


Lugar 1 Lugar 2 Lugar 3 Lugar 4 
B: 13 C: 21 Ex 9 A: 11 
A: 18 A: 20 B: 12 C: 10 
Cc: 12 B: 23 A: 14 B: 17 


Realice un análisis de varianza de bloques completos 
aleatorizados con el objetivo de probar la hipótesis de 
que no hay diferencia en la capacidad de rendimiento 
de las 3 variedades de papas. Utilice un nivel de signi- 
ficancia de 0.05 y saque conclusiones. 

13.27 Los siguientes datos son los porcentajes de adi- 
tivos extranjeros, medidos por 5 analistas, de 3 marcas 
distintas de mermelada de fresa, A, B y C. 

Analista 1 Analista 2 Analista 3 Analista 4 Analista 5 


A un nivel de significancia de 0.05, realice un análisis 
de varianza de bloques completos aleatorizados para 
probar la hipótesis de que el porcentaje de aditivos ex- 
tranjeros es el mismo para las tres marcas de mermela- 
da. ¿Cuál de ellas parece tener menos aditivos? 


13.28 Los siguientes datos representan las califica- 
ciones finales obtenidas por 5 estudiantes en matemáti- 
cas, inglés, francés y biología: 


Materia 
Estudiante Matemáticas Inglés Francés Biología 
1 68 57 73 61 
2 83 94 91 86 
3 72 81 63 59 
4 55 73 77 66 
5 92 68 75 87 


Pruebe la hipótesis de que los cursos tienen la misma 
dificultad. Use un valor P en sus conclusiones y analice 
sus hallazgos. 


13.29 En el estudio The Periphyton of the South Ri- 
ver, Virginia: Mercury Concentration, Productivity, 
and Autotropic Index Studies, efectuado por el Departa- 
mento de Ciencias e Ingeniería Ambientales de Virgi- 
nia Tech, se midió la concentración total de mercurio 
en sólidos totales de perifitón en seis estaciones distin- 
tas durante seis días diferentes. Determine si el conte- 
nido medio de mercurio difiere significativamente entre 
las estaciones utilizando los siguientes datos. Use un 
valor P y analice sus hallazgos. 


Estación 
Fecha CA СВ El E2 E3 E4 
8 de abril 045 3.24 133 204 3.93 5.93 
23 de junio 0.10 0.10 0.99 4.31 9.92 6.49 
1 de julio 0.25 0.25 165 3.13 739 443 
8de julio 0.09 006 092 366 7.88 624 
15 de julio 0.15 0.16 2.17 3.50 8.82 5.39 
23 de julio 0.17 0.39 4.30 2.91 5.50 4.29 


13.30 Una planta de energía nuclear produce una gran 
cantidad de calor que generalmente se descarga en los 
sistemas de agua. Ese calor eleva la temperatura del lí- 
quido, lo cual da como resultado una mayor concentra- 
ción de clorofila a que, a su vez, alarga la temporada de 
crecimiento. Para estudiar este efecto se tomaron mues- 
tras de agua mensualmente en 3 estaciones, durante un 
periodo de 12 meses. La estación A es la que se ubica 
más cerca de una descarga potencial de agua caliente, la 
estación C es la más lejana de la descarga y la estación 
B se encuentra entre las estaciones A y C. Se registraron 
las siguientes concentraciones de clorofila a. 
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Estación 
Mes A B C 
Enero 9.867 3.723 4.410 
Febrero 14.035 8.416 11.100 
Marzo 10.700 20.723 4.470 
Abril 13.853 9.168 8.010 
Mayo 7.067 4778 34.080 
Junio 11.670 9.145 8.990 
Julio 7.357 8.463 3.350 
Agosto 3.358 4.086 4.500 
Septiembre 4.210 4.233 6.830 
Octubre 3.630 2.320 5.800 
Noviembre 2953 3.843 3.480 
Diciembre 2.640 3.610 3.020 


Realice un análisis de varianza y, a un nivel de signifi- 
cancia de 0.05, pruebe la hipótesis de que no hay dife- 
rencia en las concentraciones medias de clorofila a en 
las 3 estaciones. 


13.31 En un estudio realizado por el Departamento 
de Salud y Educación Física de Virginia Tech, se asig- 
naron 3 dietas durante 3 días a 6 sujetos utilizando un 
diseño de bloques completos aleatorizados. Los suje- 
tos, que desempeñan el papel de bloques, recibieron las 
siguientes 3 dietas en orden aleatorio: 


Dieta 1: grasas mixtas y carbohidratos, 
Dieta 2: alta en grasas, 
Dieta 3: alta en carbohidratos. 


Al terminar el periodo de tres días se puso a cada sujeto 
en una banda caminadora y se midió el tiempo, en se- 
gundos, que transcurría hasta que se sentían exhaustos. 
Efectúe un análisis de varianza separando la dieta, los 
sujetos y la suma de cuadrados del error. Utilice un va- 
lor P para determinar si existen diferencias significati- 
vas entre las dietas. Los datos registrados son los 
siguientes: 
Sujeto 
Dieta 1 2 3 4 5 6 
1 84 35 91 57 56 45 


2 91 48 711 45 61 61 
3 122 53 110 71 91 


13.32 El personal forestal utiliza arsénico orgánico 
como arboricida. La cantidad de arsénico que absorbe 
el cuerpo cuando se expone a este producto constituye 
un grave problema de salud. Es importante que la can- 
tidad de exposición se determine rápido, de manera que 
pueda retirarse del trabajo a los empleados con niveles 
elevados de arsénico. En un experimento descrito en el 
artículo “A Rapid Method for the Determination of Ar- 
senic Concentrations in Urine at Field Locations”, pu- 
blicado en el American Industrial Hygiene Association 
Journal (Vol. 37, 1976), especímenes de orina de 4 per- 
sonas del servicio forestal fueron divididos por igual en 
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tres muestras para que pudiera analizarse el contenido 
de arsénico en la orina de cada individuo en un labora- 
torio universitario: las muestras eran analizadas por un 
químico con un sistema portátil, así como también por 
un empleado forestal que había recibido una capacita- 
ción breve. Se registraron los siguientes niveles de ar- 
sénico, en partes por millón: 


Analista 
Individuo Empleado Químico Laboratorio 
1 0.05 0.05 0.04 
2 0.05 0.05 0.04 
3 0.04 0.04 0.03 
4 0.15 0.17 0.10 


Realice un análisis de varianza y, a un nivel de signifi- 
cancia de 0.05, pruebe la hipótesis de que no hay dife- 
rencia en los niveles de arsénico con los tres métodos 
de análisis. 


13.33 Los científicos del Departamento de Patología 
Vegetal de Virginia Tech realizaron un experimento en 
el que se aplicaron 5 tratamientos diferentes en 6 luga- 
res distintos de un huerto de manzanas para determinar 
si había diferencias significativas en el crecimiento en- 
tre los tratamientos. Los tratamientos 1 a 4 representan 
distintos herbicidas y el 5 es un control. El periodo de 
crecimiento fue de mayo a noviembre de 1982, y los 
datos de crecimiento nuevo, medido en centímetros, 
para muestras seleccionadas de los 6 lugares en el huer- 
to, son los siguientes: 


Ubicaciones 
Tratamiento 1 2 3 4 5 6 
1 455 72 61 215 695 501 
2 622 82 444 170 437 134 
3 695 56 50 443 701 373 
4 607 650 493 257 490 262 
5 388 263 185 103 518 622 


Lleve a cabo un análisis de varianza, separando el tra- 
tamiento, el lugar y la suma de cuadrados del error. De- 
termine si hay diferencias significativas entre las 
medias de los tratamientos. Mencione un valor P. 


13.34 En el artículo “Self-Control and Therapist 
Control in the Behavioral Treatment of Overweight 
Women”, publicado en Behavioral Research and The- 
rapy (Vol. 10, 1972), se estudiaron dos tratamientos de 
reducción y otro de control para observar sus efectos en 
el cambio del peso en mujeres obesas. Los dos trata- 
mientos reductores involucrados fueron un programa 
autodirigido de reducción de peso y otro controlado por 
un terapeuta. Se asignó a cada uno de 10 sujetos a uno 
de los 3 programas de tratamiento en orden aleatorio y 
se midió la pérdida de peso. Se registraron los siguien- 
tes cambios en el peso: 


13.11 Modelos de efectos aleatorios 


Tratamiento 
Sujeto Control Autodirigido Con terapeuta 
1 1.00 —2.25 — 10.50 
2 3.75 — 6.00 — 13.50 
3 0.00 —2.00 0.75 
4 —0.25 —1.50 —4.50 
5 —2.25 — 3.25 — 6.00 
б — 1.00 — 1.50 4.00 
7 — 1.00 — 10.75 — 12.25 
8 3.75 — 0.75 — 2.75 
9 1.50 0.00 —6.75 
10 0.50 — 3.75 — 7.00 


Realice un análisis de varianza y, а un nivel de signifi- 
cancia de 0.01, pruebe la hipótesis de que no hay dife- 
rencia en las pérdidas de peso promedio para los 3 
tratamientos. ¿Cuál tratamiento fue el mejor? 


13.35 En el libro Design of Experiments for the Qua- 
lity Improvement, publicado por la Japanese Standards 
Association (1989) se reportó un estudio sobre la canti- 
dad de tinta que se requiere para obtener el mejor color 
para cierto tipo de tela. En dos plantas diferentes se 
administraron tres cantidades de tinta: 1 del porcentaje 
de wof, es decir, 1 del porcentaje del peso de la tela, 
1% de wof y 3% de wof. Después se observó cuatro 
veces la densidad del color de la tela para cada nivel de 
tinta aplicada en cada planta. 


Cantidad de tinta 
1/3% 1% 3% 
Planta 1 5.2 6.0 | 123 105 | 224 178 
59 5.9 | 124 10.9 | 225 18.4 
Planta2 6.5 5.5 [145 11.8 | 29.0 232 
6.4 5.9 | 160 13.6 | 297 240 


A un nivel de significancia de 0.05, realice un análisis 
de varianza para probar la hipótesis de que no hay dife- 
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rencia en la densidad de color de la tela con los tres 
niveles de tinta. Considere a las plantas como bloques. 


13.36 Se realizó un experimento con el fin de compa- 
rar tres tipos de materiales para recubrir alambres de 
cobre. El propósito del recubrimiento consiste en eli- 
minar los “defectos” del alambre. A cada recubrimien- 
to se le asignaron al azar 10 especímenes distintos, 
de 5 milímetros de longitud, para que les fuera aplica- 
do. Después se sometió a los 30 especímenes a cierto 
tipo de desgaste abrasivo. Al final se midió el número 
de defectos en cada uno y se obtuvieron los siguientes 
resultados: 


Material 
1 2 3 
6 8 4 53 3 5 4|12 8 7 14 
7 7 9 612 4 4 5|18 6 7 18 
7 8 4 3 8 5 


Suponga que se acepta que se puede aplicar un proceso 
de Poisson, por lo que el modelo es Y, = p, + є,, donde 
4, es la media de la distribución de Poisson у Су, = Ш. 

а) Haga una transformación apropiada de los datos у 
un análisis de varianza. 

b) Determine si hay evidencia suficiente para preferir 
un material de recubrimiento sobre los demás. 
Muestre cualesquiera hallazgos que sugieran una 
conclusión. 

с) Haga una gráfica de residuales y coméntela. 

d) Mencione el propósito de la transformación de los 
datos. 

e) ¿Qué otra suposición se hace en este caso, que qui- 
zá la transformación no cumpla por completo? 

f) Comente el inciso e después de elaborar una gráfi- 
ca de probabilidad normal sobre los residuales. 


A lo largo de este capítulo estudiamos los procedimientos del análisis de varianza en los 
que el objetivo principal es estudiar el efecto sobre ciertas respuestas de ciertos tratamien- 
tos fijos o predeterminados. Los experimentos en los que los tratamientos o los niveles de 
tratamiento son preseleccionados por el experimentador, y no elegidos al azar, se deno- 
minan experimentos de efectos fijos. Para el modelo de efectos fijos sólo se hacen infe- 
rencias acerca de los tratamientos específicos que se utilizaron en el experimento. 

Con frecuencia es importante que el experimentador sea capaz de hacer inferencias 
acerca de una población de tratamientos a través de un experimento en el que los trata- 
mientos empleados se elijan al azar de entre la población. Por ejemplo, un biólogo podría 
estar interesado en saber si hay o no una varianza significativa en alguna característica 
fisiológica debida a un tipo de animal. Los tipos de animales que en realidad se usan en 
el experimento se eligen al azar y representan los efectos del tratamiento. Un químico 
podría estar interesado en estudiar el efecto de los laboratorios sobre el análisis químico de 
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una sustancia; no le interesa un laboratorio en particular, sino una población grande de 
laboratorios. Así, podría seleccionar al azar un grupo de laboratorios y asignar muestras 
a cada uno para su análisis. Entonces, la inferencia estadística implicaría 1) probar si los 
laboratorios contribuyen o no a una varianza diferente de cero en los resultados de los aná- 
lisis, y 2) estimar la varianza debida a los laboratorios y a la varianza dentro de los mismos. 


Modelo y suposiciones para el modelo de efectos aleatorios 


Teorema 13.4: 


El modelo de efectos aleatorios de un solo factor se escribe como el modelo de efectos 
fijos, pero sus términos tienen significados diferentes. La respuesta y, = н +0, + €, es 
ahora un valor de la variable aleatoria 


Y =p +A¡+ej coni=1,2,...,k yj=1,2,...,N, 


donde las A, tienen distribución normal e independiente con media igual a cero y varian- 

za O, y son independientes de las €; Al igual que para el modelo de efectos fijos, las €, 

también tienen distribución normal e independiente con media igual a cero y varianza 

o°. Observe que рага un experimento de efectos aleatorios, ya no se aplica la restricción 
k 


deque о,=0. 
і=1 


Рага el modelo del análisis de varianza de efectos aleatorios de un solo factor, 
E(SCT)=(k-Do?*+nk-Do0? у Е(ЅСЕ) = k(m-— 1)o?. 


La tabla 13.11 presenta los cuadrados medios esperados tanto para un experimento 
de efectos fijos como para uno de efectos aleatorios. Los cálculos para un experimento de 
efectos aleatorios se realizan exactamente de la misma forma que los del experimento 
de efectos fijos. Es decir, la suma de cuadrados, los grados de libertad y las columnas de 
los cuadrados medios en la tabla del análisis de varianza son iguales para ambos modelos. 


Tabla 13.11: Cuadrados medios esperados para el experimento de un solo factor 


Fuente de Grados de Cuadrados Cuadrados medios esperados 
variación libertad medios Efectos fijos Efectos aleatorios 
Tratamientos k=1 sî o’ + Кет а а? +no} 

1 
Error k(n = 1) s? o? о? 
Total nk — 1 


Para el modelo de efectos aleatorios la hipótesis de que todos los efectos del trata- 
miento son iguales a cero se escribe como sigue: 


Hipótesis para un 
experimento de 
efectos aleatorios 


Ho: б^ = 0, 
Ну: 02 # 0. 


Esta hipótesis afirma que los diferentes tratamientos no contribuyen en absoluto a la 
variabilidad de la respuesta. De la tabla 13.11 es evidente que tanto 5; сото s? son esti- 
mados de с? cuando Н, es verdadera, y que la razón 
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es un valor de la variable aleatoria F que tiene la distribución F con k — 1 y k(n — 1) gra- 
dos de libertad. La hipótesis nula se rechaza a un nivel de significancia (y cuando 


f> falk—1,k(n— D]. 


En muchos estudios científicos y de ingeniería el interés no se centra en la prueba F. 
El científico sabe que el efecto aleatorio, en efecto, es significativo. Lo más importante 
es la estimación de los diversos componentes de la varianza. Esto produce un sentido de 
jerarquía en términos de cuáles factores producen la mayor variabilidad y en qué cantidad. 
En este contexto podría ser interesante cuantificar cuánto más grande es el componente 
de la varianza de un solo factor que el producido por el azar (variación aleatoria). 


Estimación de los componentes de la varianza 


La tabla 13.11 también se utiliza para estimar los componentes de la varianza с? y 0. 
Como 5? estima 0? + no”, у s? estima 07, 


Ejemplo 13.7: | Los datos de la tabla 13.12 representan observaciones codificadas sobre el producto de 
un proceso químico en el que se utilizan 5 lotes de materia prima seleccionados al azar. 
Demuestre que el componente de la varianza del lote es significativamente mayor que 
cero y obtenga su estimado. 


Tabla 13.12: Datos para el ejemplo 13.7 


Lote 1 2 3 4 5 


9.7 10.4 15.9 8.6 9.7 
5.6 9.6 14.4 11.1 12.8 
8.4 7.3 8.3 10.7 8.7 
7.9 6.8 12.8 7.6 13.4 
8.2 8.8 7.9 6.4 8.3 
TT 9.2 11.6 5:9 11.7 
8.1 7.6 9.8 8.1 10.7 


Total 55.6 59.7 80.7 58.4 75.3 329.7 


Solución: La suma total de cuadrados, Ја del lote y la suma de cuadrados del error son, respecti- 
vamente, 


STC = 194.64, SCT = 72.60 y SCE = 194.64 — 72.60 = 122.04. 


En la tabla 13.13 se presentan estos resultados con el resto de los cálculos. 
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Tabla 13.13: Análisis de la varianza para el ejemplo 13.7 


Fuente de Ѕита іе Grados de Cuadrado f 
variación cuadrados libertad medio calculada 
Lotes 72.60 4 18.15 4.46 
Error 122.04 30 4.07 

Total 194.64 34 


La razón fes significativa al nivel œ = 0.05, lo que indica que se rechaza la hipótesis 
de un componente del lote igual a cero. Una estimación del componente de la varianza 
del lote es 


„2 _ 18.15 — 4.07 


62 = > =2.01. 


Observe que mientras que el componente de la varianza del lote es significativamente 
diferente de cero, cuando se compara contra el estimado de a”, es decir, б? = СМЕ = 4.07, 
pareciera que el componente de varianza del lote no es considerablemente grande. 8 

Si el resultado que se obtiene con la fórmula para O es negativo, o sea, que s? es 
menor que s?, entonces a 62 se le asigna un valor de cero. Éste es un estimador sesgado. 
Para tener un mejor estimador de g4, suele emplearse un método llamado verosimilitud 
restringida (o residual) máxima (REML por sus siglas en inglés) (véase Harville, 
1977, en la bibliografía). Este tipo de estimador se puede encontrar en muchos paquetes 
estadísticos para computadora. Los detalles de dicho procedimiento rebasan el alcance 
de este libro. 


Diseño de bloques aleatorizados con bloques aleatorios 


En un experimento de bloques completos aleatorizados, donde los bloques representan 
días, es concebible que el experimentador quiera que los resultados se apliquen no sólo 
a los días reales utilizados en el análisis, sino a cada día del año. Entonces, seleccionaría 
al azar los días en que se haría el experimento, así como los tratamientos y el modelo de 
efectos aleatorios a utilizar. 


Yi = 4 +A; + В; + єў, parai=1,2,...,k yj=1,2,...,b, 


donde las A, В y є, Son variables aleatorias independientes con medias igual a cero y 
varianzas O4, сӯ y 0”, respectivamente. Se obtienen los cuadrados medios esperados 
para un diseño de bloques completos aleatorizados de efectos aleatorios usando el mismo 
procedimiento que se usó en el problema de un solo factor; en la tabla 13.14 se presentan 
junto con los de un experimento de efectos fijos. 

Nuevamente, los cálculos para las sumas de cuadrados y grados de libertad indivi- 
duales son idénticos a los del modelo de efectos fijos. Las hipótesis 


Ho: а2 = 0, 
Н: о #0 


se obtienen calculando 


13.12 Estudio de caso 551 


Tabla 13.14: Cuadrados medios esperados para un diseño de bloques completos 


aleatorizados 

Fuente de Grados de Cuadrados Cuadrados medios esperados 

variación libertad medios Efectos fijos Efectos aleatorios 
b 

Tratamientos k=1 s? а? + E=i E о? о? + bo? 
k 

Bloques b=1 52 а? + al NS а? + код 
тле] 

Error (К —1)(b —1) s? o? 0? 

Total kb — 1 


y H, se rechaza cuando f > falk — 1, (b — 1)(k — 1)]. 
Los estimados no sesgados de los componentes de la varianza son 


22 2 22 S1 — S А 
O Q 


Las pruebas de las hipótesis referentes a los diversos componentes de la varianza se 
realizan calculando las razones de los cuadrados medios adecuados, tal como se indica 
en la tabla 13.14, y comparándolos con los valores f correspondientes de la tabla A.6. 


13.12 Estudio de caso 


Estudio de caso 13.1: [Análisis químico. Se pidió al personal del Departamento de Química de Virginia Tech 
que analizara un conjunto de datos que se obtuvo para comparar 4 métodos distintos de 
análisis del aluminio en cierta mezcla deflagradora sólida. Para considerar una amplia 
gama de laboratorios de análisis se utilizaron 5 de ellos en el experimento. Se seleccio- 
naron esos laboratorios porque suelen realizar esa clase de análisis. Se asignaron al azar 
20 muestras de material deflagrador que contenían 2.70% de aluminio, cuatro a cada 
laboratorio, y se dieron instrucciones acerca de cómo efectuar los análisis químicos uti- 
lizando los cuatro métodos. Los datos que se obtuvieron son los siguientes: 


Laboratorio 
Método 1 2 3 4 5 Media 


2.67 2.69 2.62 2.66 2.70 2.668 
271 274 2.69 2.70 277 2.722 
2.76 2.76 2.70 2.76 2.81 2.758 
2.65 2.69 2.60 2.64 2.73 2.662 


осо» 


Los laboratorios no se consideran efectos aleatorios, ya que no fueron seleccionados 
al azar de entre una población más grande de ellos. Los datos se analizaron como un 
diseño de bloques completos aleatorizados. Se dibujaron gráficas de los datos para deter- 
minar si era apropiado un modelo aditivo del tipo: 


уу =н+т +1; +е) 
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en otras palabras, un modelo con efectos aditivos. El bloque aleatorizado no es adecuado 
cuando existe interacción entre los laboratorios y los métodos. Considere la gráfica de 
la figura 13.12. Aunque es un poco difícil de interpretar porque cada punto representa 
una sola observación, parece que no hay interacción evidente entre los métodos y los 
laboratorios. 


2.85 
2.80 
2.75 


2.70 


Respuesta 


2.65 


2.60 


Método 


Figura 13.12: Gráfica de interacción para los datos del estudio de caso 13.1. 


Gráficas de residuales 


Las gráficas de residuales se usaron como indicaciones de diagnóstico con respecto a la 
suposición de una varianza homogénea. La figura 13.13 presenta una gráfica de residua- 
les contra los métodos de análisis. La variabilidad descrita en los residuales parece ser 
bastante homogénea. Para completar, en la figura 13.14 se presenta una gráfica de pro- 
babilidad normal de los residuales. 


0.02 
0.015 
{w 0.005 
3 = 
3 0.00 E 
8 Œ _0.005 
—0.015 
ет B C D -2 -1 0 1 2 
Método Cuantil normal estándar 
Figura 13.13: Gráfica de residuales en comparación Figura 13.14: Gráfica de probabilidad normal de 


con el método para los datos del estudio de caso 13.1. residuales para los datos del estudio de caso 13.1. 


Las gráficas de residuales no muestran problemas con la suposición de errores nor- 
males ni con la de varianza homogénea. Para hacer el análisis de varianza se utilizó la 
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función PROC GLM del programa SAS. En la figura 13.15 se incluye una salida de re- 
sultados por computadora con comentarios. 

Los valores fy P calculados sí indican una diferencia significativa entre los métodos 
de análisis. A este análisis le puede seguir un análisis de comparación múltiple para de- 
terminar en dónde están las diferencias entre los métodos. 


Ejercicios 

13.37 Al probar muestras de sangre de un paciente 
para detectar anticuerpos del VIH un espectrómetro de- 
termina la densidad óptica de cada muestra. La densi- 
dad óptica se mide como la absorbencia de la luz de 
cierta longitud de onda. La muestra de sangre es positi- 
va si excede a cierto valor límite que se determina con 
muestras de control para esa corrida. A los investigado- 
res les interesa comparar la variabilidad del laboratorio 
para los valores de control positivo. Los datos represen- 
tan valores de control positivo para 10 corridas distin- 
tas en cuatro laboratorios seleccionados al azar. 


Laboratorio 
Corrida 1 2 3 4 
1 0.888 1.065 1.325 1.232 
2 0.983 1.226 1.069 1.127 
3 1.047 1.332 1.219 1.051 
4 1.087 0.958 0.958 0.897 
5 1.125 0.816 0.819 1.222 
б 0.997 1.015 1.140 1.125 
7 1.025 1.071 1.222 0.990 
8 0.969 0.905 0.995 0.875 
9 0.898 1.140 0.928 0.930 
10 1.018 1.051 1.322 0.775 


a) Escriba un modelo adecuado para este experimento. 
b) Estime el componente de varianza del laboratorio 
y la varianza dentro de los laboratorios. 


13.38 Se efectúa un experimento en el que se compa- 
rarán 4 tratamientos en 5 bloques. Los datos son los 
siguientes: 


Bloque 
Tratamiento 1 2 3 4 5 
1 128 106 117 107 11.0 
2 117 142 118 99 13.8 
3 115 147 13.6 10.7 15.9 
4 12.6 16.5 15.4 9.6 17.1 


a) Suponga que se trata de un modelo de efectos 
aleatorios y pruebe la hipótesis de que no hay dife- 
rencia entre las medias de los tratamientos, a un 
nivel de significancia de 0.05. 

b) Calcule estimados de los componentes de la va- 
rianza del tratamiento y del bloque. 


13.39 Los siguientes datos muestran el efecto de cua- 
tro operadores, elegidos al azar, sobre la producción de 
una máquina específica: 


Operador 
1 2 3 4 
175.4 168.5 170.1 175.2 
171.7 162.7 1734 175.7 
173.0 165.0 175.7 180.1 
170.5 164.1 170.7 183.7 


a) Realice un análisis de varianza de efectos aleato- 
rios a un nivel de significancia de 0.05. 

b) Calcule un estimado del componente de la varian- 
za del operador y del componente de la varianza 
del error experimental. 

13.40 De cinco “vaciados” de metales se tomaron 
cinco muestras del núcleo y en cada una se analizó la 
cantidad de un elemento traza. Los siguientes son los 
datos de los 5 vaciados seleccionados al azar: 


Vaciado 
Núcleo 1 2 3 4 5 
1 0.98 0.85 1.12 1.21 1.00 
2 102 0.92 1.68 1.19 1.21 
3 157 1.16 0.99 1.32 0.93 
4 125 1.43 1.26 1.08 0.86 
5 1.16 0.99 1.05 0.94 1.41 


a) La intención es que los vaciados sean idénticos. Por 
lo tanto, pruebe que el componente de la varianza 
del “vaciado” es igual a cero. Saque conclusiones. 

b) Realice un ANOVA completo y obtenga un esti- 
mado de la varianza dentro del vaciado. 


13.41 Una empresa textil produce cierta tela en un 
número grande de telares. Los gerentes quieren que los 
telares sean homogéneos para que la tela que producen 
tenga una resistencia uniforme. Se sospecha que puede 
haber una variación significativa entre la resistencia de 
los telares. Considere los siguientes datos para 4 telares 
seleccionados al azar. Cada observación es una deter- 
minación de la resistencia de la tela expresada en libras 
por pulgada cuadrada. 
Telar 

1 2 3 4 

99 97 %4 93 

97 96 95 94 

97 92 90 90 

96 98 92 92 


a) Escriba un modelo para el experimento. 

b) ¿El componente de la varianza del telar difiere sig- 
nificativamente de cero? 

c) Haga comentarios sobre la sospecha de los gerentes. 
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The GLM Procedure 


Class Level Information 


Class Levels Values 

Method 4 ABCD 

Lab 5 1.2: 3:45: 
Number of Observations Read 20 
Number of Observations Used 20 


Dependent Variable: Response 


Sum of 
Source DF Squares Mean Square F Value Pr > F 
Model 7 0.05340500 0.00762929 42.19 <.0001 
Error 12 0.00217000 0.00018083 


Corrected Total 19 0.05557500 


R-Square Coeff Var Root MSE Response Mean 
0.960954 0.497592 0.013447 2.702500 
Source DF Type III SS Mean Square F Value PY >Р 
Method 3 0.03145500 0.01048500 57.98 <.0001 
Lab 4 0.02195000 0.00548750 30:35 <.0001 
Observation Observed Predicted Residual 
1 2.67000000 2.66300000 0.. 00700000 
2 2.71000000 271700000 -0.00700000 
3 2.76000000 2.75300000 0.00700000 
4 2.65000000 2.65700000 -0.00700000 
5 2.69000000 2.68550000 0.00450000 
6 2.74000000 2.73950000 0.00050000 
7 2.76000000 2.77550000 -0.01550000 
8 2.69000000 2.67950000 0.01050000 
9 2.62000000 2.61800000 0.00200000 
10 2.69000000 2.67200000 0.01800000 
11 2.70000000 2.70800000 -0.00800000 
12 2.60000000 2.61200000 -0.01200000 
13 2.66000000 2.65550000 0.00450000 
14 2.70000000 2.70950000 -0.00950000 
15 2.76000000 2.74550000 0.01450000 
16 2.64000000 2.64950000 -0.00950000 
17 2.70000000 2.71800000 -0.01800000 
18 2.77000000 2.77200000 -0.00200000 
19 2.81000000 2.80800000 0.00200000 
20 2.73000000 2. 71200000 0.01800000 


Figura 13.15: Salida de resultados por computadora del SAS para los datos del estudio de caso 13.1. 
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13.42 El Centro de Consultoría en Estadística de Vir- 
ginia Tech, junto con el Departamento de Silvicultura, 
llevaron a cabo un análisis. Se aplicó cierto tratamiento 
a tres cepas de árbol. Se empleó el producto químico 
Garlon con el fin de regenerar las raíces de las cepas. Se 
usó un aerosol con cuatro niveles de concentración de 
Garlon. Después de cierto tiempo, se observó la altura 
de los retoños. Realice un análisis de varianza de un 
solo factor con los siguientes datos. Haga pruebas para 
saber si la concentración de Garlon tiene un efecto signi- 
ficativo sobre la altura de los retoños. Emplee а = 0.05. 


Nivel de Garlon 
1 | 2 | 3 | 4 
2.87 231 | 3.27 2.66 | 2.39 1.91 | 3.05 0.91 
3.91 2.04 | 3.15 2.00 | 2.89 1.89 | 2.43 0.01 


13.43 Considere los datos de los agregados del ejem- 
plo 13.1. Efectúe una prueba de Bartlett a un nivel de 
significancia œ = 0.1 para determinar si hay heteroge- 
neidad en la varianza entre los agregados. 


13.44 En un proceso químico se utilizaron 3 catalizado- 


res y también se incluyó un control (no catalizador). Se 
tienen los datos siguientes de la producción del proceso: 


Catalizador 
Control 1 2 3 
74.5 77.5 81.5 78.1 
76.1 82.0 823 80.2 
75.9 80.6 81.4 81.5 
78.1 84.9 795 83.0 
76.2 81.0 83.0 82.1 


Use una prueba de Dunnett a un nivel de significancia 
а = 0.01 para determinar si se obtuvo una producción 
significativamente más alta con los catalizadores que 
sin ellos. 


13.45 Se emplean cuatro laboratorios para efectuar 
análisis químicos. Se envían muestras del mismo mate- 
rial a los laboratorios para que, como parte del estudio, 
las analicen para determinar si dan o no, en promedio, 
los mismos resultados. Los resultados analíticos de los 
cuatro laboratorios son los siguientes: 


Laboratorio 
A B C D 
58.7 62.7 55.9 60.7 
61.4 64.5 561 60.3 
60.9 63.1 573 60.9 
59.1 592 552 61.4 
58.2 60.3 58.1 62.3 


a) Utilice una prueba de Bartlett para demostrar que 
las varianzas dentro de los laboratorios no difieren 
de manera significativa a un nivel de significancia 
а = 0.05. 
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b) Realice el análisis de varianza y saque conclusio- 
nes acerca de los laboratorios. 

c) Dibuje una gráfica de probabilidad normal de resi- 
duales. 


13.46 Se diseñó un experimento para el personal del 
Departamento de Ciencia Animal de Virginia Tech, con 
el propósito de estudiar el tratamiento con urea y amo- 
niaco acuoso de la espiga del trigo. El propósito era 
mejorar el valor nutricional para las ovejas macho. Los 
tratamientos dietéticos son: control, urea en la alimen- 
tación, espiga tratada con amoniaco, espiga tratada con 
urea. En el experimento se emplearon 24 ovejas y se 
separaron de acuerdo con su peso relativo. En cada gru- 
po homogéneo había cuatro ovejas (según el peso) y 
cada una recibió una de las cuatro dietas en orden alea- 
torio. Se midió el porcentaje de materia seca digerida 
de las 24 ovejas. Los siguientes son los datos: 


Grupo por peso (bloque) 
Dieta 1 2 3 4 5 6 
32.68 36.22 36.36 40.95 34.99 33.89 


Control 


Urea en la 
alimentación 35.90 38.73 37.55 34.64 37.36 34.35 
Tratada con 
amoniaco 
Tratada 
con urea 


49.43 53.50 52.86 45.00 47.20 49.76 


46.58 42.82 45.41 45.08 43.81 47.40 


a) Use un análisis de bloques completos aleatoriza- 
dos para probar las diferencias entre las dietas. 
Emplee а = 0.05. 

b) Utilice la prueba de Dunnett para comparar las tres 
dietas con el control. Utilice о = 0.05. 

c) Dibuje una gráfica de probabilidad normal de los 
residuales. 


13.47 En un estudio realizado por el personal del De- 
partamento de Bioquímica de Virginia Tech se dieron 
tres dietas a un grupo de ratas con el objetivo de estu- 
diar el efecto de cada una sobre el zinc dietético resi- 
dual en el torrente sanguíneo. Se asignaron al azar 
cinco ratas preñadas a cada grupo dietético, y cada una 
recibió la dieta en el día 22 del embarazo. Se midió la 
cantidad de zinc en partes por millón. Los datos son los 
que siguen: 
1 | 0.50 0.42 0.65 0.47 0.44 
Dieta 2 | 0.42 0.40 0.73 0.47 0.69 
3 | 106 0.82 0.72 0.72 0.82 


Determine si hay una diferencia significativa en el zinc 
dietético residual entre las tres dietas. Use œ = 0.05. 
Lleve a cabo un ANOVA de un solo factor. 
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13.48 Se realizó un experimento para comparar tres 
tipos de pintura para buscar evidencia de diferencias en 
su calidad de desgaste. Las pinturas se expusieron a ac- 
ciones abrasivas y se registró el tiempo, en horas, que 
tardaba en observarse la abrasión. Se usaron seis espe- 
címenes para cada tipo de pintura. Los datos son los 
siguientes: 


Tipo de pintura 
1 | 2 | 3 
158 97 282 | 515 264 544 | 317 662 213 
315 220 115 | 525 330 525 | 536 175 614 


a) Realice un análisis de varianza para determinar si 
la evidencia sugiere que la calidad del desgaste de 
las tres pinturas es diferente. Utilice un valor P en 
sus conclusiones. 

b) Si se encuentran diferencias significativas, diga 
cuáles son. ¿Hay alguna pintura que destaque? 
Analice sus hallazgos. 

c) Haga todos los análisis gráficos que necesite para 
determinar si son válidas las suposiciones que se 
hicieron en el inciso a. Analice sus hallazgos. 

d) Suponga que se determina que los datos para cada 
tratamiento tienen una distribución exponencial. 
¿Sugiere esto un análisis alternativo? Si fuera así, 
hágalo y presente sus hallazgos. 


13.49 Una empresa que troquela juntas de hojas de 
caucho, plástico y corcho desea comparar el número 
medio de juntas producidas por hora para los tres tipos 
de material. Se eligieron al azar dos máquinas troque- 
ladoras como bloques. Los datos representan el número 
de juntas (en miles) producidas por hora. En la figura 
13.16 de la página 557 se observa la salida de resulta- 
dos del análisis. 

Material 
Máquina Corcho Caucho Plástico 


A 4.31 4.27 4.40[3.36 3.42 3.48|4.01 3.94 3.89 
В 3.94 3.81 3.99/3.91 3.80 3.85/3.48 3.53 3.42 


а) ¿Por qué se eligieron las máquinas troqueladoras 
como bloques? 

b) Grafique las seis medias para las combinaciones 
de máquinas y materiales. 

c) ¿Hay un material que sea mejor? 

d) ¿Existe interacción entre los tratamientos y los 
bloques? Si es así, diga si la interacción ocasiona 
alguna dificultad seria para llegar a una conclusión 
adecuada. Explique su respuesta. 


13.50 Se hizo un estudio para comparar el rendimien- 
to de tres marcas de gasolina competidoras. Se selec- 
cionaron al azar cuatro modelos de automóvil de 
tamaño variable. A continuación se presentan los datos, 
en millas por galón. El orden de prueba es aleatorio 
para cada modelo. 
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Marca de gasolina 
Modelo А B C 


A 324 35.6 38.7 
В 28.8 28.6 29.9 
C 36.5 37.6 39.1 
D 34.4 36.2 37.9 


a) Analice la necesidad de utilizar más de un solo 
modelo de automóvil. 


b) Considere el ANOVA de la salida de resultados del 
SAS en la figura 13.17. ¿Es importante la marca de 
la gasolina? 

с) ¿Qué marca de gasolina seleccionaría usted? Con- 
sulte el resultado de la prueba de Duncan. 


13.51 Se utilizaron cuatro localidades diferentes del 
noreste para hacer mediciones de ozono, en partes por 
millón. Se recolectaron las cantidades de ozono en cin- 
co muestras de cada localidad. 


Localidad 
1 2 3 4 
0.09 0.15 0.10 0.10 
0.10 0.12 0.13 0.07 
0.08 0.17 0.08 0.05 
0.08 0.18 0.08 0.08 
0.11 0.14 0.09 0.09 


а) ¿Hay información suficiente que sugiera que exis- 
ten diferencias en los niveles medios de ozono en- 
tre las diferentes localidades? Guíese usando un 
valor P. 

b) Si se encuentran diferencias significativas en el in- 
ciso a, determine su naturaleza. Emplee cuales- 
quiera métodos que haya aprendido. 


13.52 Demuestre que el cuadrado medio del error 
2 _ ЎСЕ 
k(n — 1) 
para el análisis de varianza en la clasificación de un 
factor es un estimado no sesgado de a”. 


13.53 Demuestre el teorema 13.2. 


13.54 Demuestre que la fórmula para calcular la 
SCB, en el análisis de varianza del diseño de bloques 
completos aleatorizados, es equivalente al término co- 
rrespondiente en la identidad del teorema 13.3. 


13.55 Para el diseño de bloques aleatorizados con К 
tratamientos y b bloques, demuestre que 


b 
E (SCB) = (b—1)0° +k X` 6}. 
j=1 


Ejercicios de repaso 
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The GLM Procedure 


Dependent Variable: gasket 
Sum of 
Source DF Squares Mean Square F Value Pr > E 
Model 5 1.68122778 0.33624556 76.52 <.0001 
Error 12 0.05273333 0.00439444 
Corrected Total 17 1. 73396111 
R-Square Coeff Var Root MSE gasket Mean 
0.969588 1.734095 0.066291 3.822778 
Source DF Туре III SS Mean Square F Value Pr > F 
material 2 0.81194444 0.40597222 92.38 <.0001 
machine 1 0.10125000 0.10125000 23.04 0.0004 
material*machine 2 0.76803333 0.38401667 87.39 <.0001 
Level of Level ЁЁ — — — э »===========> gasket----------- 
material machine N Mean Std Dev 
cork A 3 4.32666667 0.06658328 
cork B 3 3.91333333 0.09291573 
plastic A 3 3.94666667 0.06027714 
plastic B 3 3.47666667 0.05507571 
rubber A 3 3.42000000 0.06000000 
rubber B 3 385333333 0.05507571 
Level of  ------------ gasket----------- 
material N Mean Std Dev 
cork 6 4.12000000 0.23765521 
plastic 6 3.71166667 0.26255793 
rubber 6 3.63666667 0.24287171 
Level of ------------ gasket----------- 
machine Mean Std Dev 
A 9 3.89777778 0.39798800 
B 9 3.74777778 0.21376259 


Figura 13.16: Salida de resultados por computadora del SAS para el ejercicio de repaso 13.49. 
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The GLM Procedure 
Dependent Variable: MPG 


Sum of 
Source DF Squares Mean Square F Value Pr > F 
Model 5 153.2508333 30-6501667 24.66 0.0006 
Error 6 7.4583333 1.2430556 
Corrected Total 11 160.7091667 
R-Square Coeff Var Root MSE MPG Mean 
9.953591 3.218448 1.114924 34.64167 
Source DF Type III SS Mean Square F Value Pr > F 
Model 3 130.3491667 43.4497222 34.95 0.0003 
Brand 2 22.9016667 11.4508333 9.21 0.0148 


Duncan's Multiple Range Test for MPG 
NOTE: This test controls the Type I comparisonwise error rate, not 


the experimentwise error rate. 


Alpha 0.05 
Error Degrees of Freedom 6 
Error Mean Square 1.243056 
Number of Means 2 3 
Critical Range 1.929 1.999 
Means with the same letter are not significantly different. 
Duncan Grouping Mean N Brand 
A 36.4000 4 C 
A 
B A 34.5000 4 B 
B 
B 33.0250 4 А 


Figura 13.17 Salida de resultados por computadora del SAS para el ejercicio de repaso 13.50. 


13.56 Proyecto de grupo: Resulta de interés deter- 
minar qué tipo de pelota deportiva se puede lanzar a la 
mayor distancia. La competencia incluye una pelota de 
tenis, una de beisbol y una de softbol. Divida el grupo 
en equipos de cinco estudiantes. Cada equipo debe di- 
señar y realizar un experimento separado, también 
debe analizar los datos de su propio experimento. Los 
cinco miembros del equipo lanzarán cada pelota (des- 
pués de calentar el brazo el tiempo adecuado). La res- 
puesta experimental será la distancia (en pies) que se 
lanza la pelota. Los datos de cada equipo incluirán 15 
observaciones. Aspectos importantes: 

a) No se trata de una competencia entre equipos. La 
competencia es entre los tres tipos de pelotas. Se 
esperaría que las conclusiones de cada equipo 
sean similares. 


b) 
c) 


d) 


e) 


En cada equipo debe haber hombres y mujeres. 

El diseño experimental de cada equipo deberá ser 
un diseño de bloques completos aleatorizados. 
Los cinco individuos que lanzan la pelota son los 
bloques. 

Asegúrese de incorporar la aleatorización adecua- 
da para realizar el experimento. 

Los resultados deberán contener una descripción 
del experimento con una tabla de ANOVA que in- 
cluya un valor P y las conclusiones apropiadas. Se 
usarán técnicas gráficas y comparaciones múlti- 
ples en caso de ser necesarias. Saquen conclusio- 
nes prácticas con respecto a las diferencias entre 
los tipos de pelotas. Sean meticulosos. 
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13.13 Posibles riesgos y errores conceptuales; 
relación con el material de otros capítulos 


Al igual que otros procedimientos estudiados en capítulos anteriores, el análisis de va- 
rianza es razonablemente robusto con respecto a la suposición de normalidad, pero no 
lo es tanto en cuanto a la suposición de varianza homogénea. También observamos que 
la prueba de Bartlett para varianzas iguales es sumamente débil en relación con la nor- 
malidad. 

Este capítulo es sumamente importante, ya que se trata de un punto “de inicio” para 
temas importantes, como el diseño de experimentos y el análisis de varianza. En el capí- 
tulo 14 se tratan los mismos temas, pero en los casos de extensiones a más de un factor 
y el análisis más complicado por la interpretación de la interacción entre factores. Hay 
ocasiones en que el papel de la interacción en un experimento científico es más impor- 
tante que el papel de los factores principales (efectos principales). Ante la presencia de 
interacciones se hace un énfasis aún mayor en las técnicas gráficas. En los capítulos 14 
y 15 será necesario proporcionar más detalles acerca del proceso de aleatorización, ya 
que el número de combinaciones de factores puede ser muy grande. 


Capítulo 14 


Experimentos factoriales 
(dos o más factores) 


14.1 Introducción 


Considere una situación en la que haya interés por estudiar el efecto de dos factores, A 
y B, sobre alguna respuesta. Por ejemplo, en un experimento químico nos gustaría variar 
en forma simultánea la presión de reacción y el tiempo de reacción, y estudiar el efecto 
que cada uno tiene sobre el producto. En un experimento biológico resulta de interés 
estudiar el efecto que tienen el tiempo de secado y la temperatura sobre la cantidad de 
sólidos (porcentaje por peso) que queda en muestras de levadura. Igual que en el capítulo 
13, el término factor se utiliza en un sentido general para denotar cualquier caracte- 
rística del experimento que pueda variar de un ensayo a otro, como la temperatura, el 
tiempo o la presión. Los niveles de un factor se definen como los valores reales que se 
utilizan en el experimento. 

Para cada uno de estos casos es importante determinar no sólo si cada uno de los 2 
factores influye en la respuesta, sino también si hay una interacción significativa entre 
ellos. En lo que se refiere a la terminología, el experimento descrito aquí es de 2 factores, 
y el diseño experimental podría ser uno completamente aleatorizado, en el que las distin- 
tas combinaciones de tratamiento se asignan al azar a todas las unidades experimentales, 
о bien, un diseño de bloques completos aleatorizados, donde las combinaciones de facto- 
res se asignan al azar dentro de los bloques. En el ejemplo de la levadura, si se empleara 
un diseño completamente aleatorizado, las distintas combinaciones de tratamientos de 
temperatura y tiempo de secado se asignarían al azar a las muestras de levadura. 

Muchos de los conceptos que se estudiaron en el capítulo 13 se extienden a 2 y 
3 factores en este capítulo. El objetivo principal de este material es el uso del diseño 
completamente aleatorizado con un experimento factorial. Un experimento factorial con 
2 factores implica ensayos experimentales (o uno solo) con todas las combinaciones de 
factores. Por ejemplo, en el caso de la temperatura y tiempo de secado con, digamos, 3 
niveles de cada uno y n = 2 corridas por cada una de las 9 combinaciones, tendríamos un 
experimento factorial de 2 factores en un diseño completamente aleatorizado. Ninguno 
de ellos es un factor de bloqueo; nos interesa la manera en que cada uno influye en el 
porcentaje de sólidos en las muestras, y si interactúan o no. El biólogo dispondría de 18 
muestras físicas de material que constituyen unidades experimentales. Luego, éstas se 
asignarían al azar a las 18 combinaciones (9 combinaciones de tratamiento, cada una de 
ellas por duplicado). 
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Antes de entrar en detalles analíticos, sumas de cuadrados y demás, sería intere- 
sante que el lector observe la clara conexión que existe entre lo que hemos descrito y la 
situación con el problema de un solo factor. Considere el experimento de la levadura. La 
explicación de los grados de libertad ayuda a que el lector o el analista visualicen la ex- 
tensión. En un inicio, las 9 combinaciones de tratamientos deberían considerarse como 
si representaran un factor con 9 niveles (8 grados de libertad). Así, un vistazo inicial a 
los grados de libertad arroja lo siguiente: 


Combinaciones de tratamiento 8 
Error 9 
Total 17 


Efectos principales e interacción 


En realidad el experimento se podría analizar como se describe en la tabla anterior. 
Sin embargo, es probable que la prueba F para las combinaciones no dé al analista la 
información que desea, es decir, el papel de la temperatura y del tiempo de secado. Tres 
tiempos de secado tienen asociados 2 grados de libertad, y a 3 temperaturas se asocian 
también 2 grados de libertad. Los factores principales, la temperatura y el tiempo de se- 
cado reciben el nombre de efectos principales, los cuales representan 4 de los 8 grados 
de libertad para las combinaciones de factores. Los 4 grados de libertad adicionales se 
asocian con la interacción entre los 2 factores. Como resultado, el análisis incluye 


Combinaciones 8 
Temperatura 2 
Tiempo de secado 2 
Interacción 4 

Error 9 

Total 17 


En el capítulo 13 vimos que en un análisis de varianza los factores pueden conside- 
rarse fijos o aleatorios, dependiendo del tipo de inferencia deseada y de la manera en que 
se eligieron los niveles. Aquí debemos considerar los efectos fijos, los efectos aleatorios 
e incluso los casos en que los efectos son mixtos. Conforme avancemos en estos temas 
pondremos mayor atención a los cuadrados medios esperados. En la siguiente sección 
nos centraremos en el concepto de interacción. 


14.2 Interacción en el experimento de dos factores 


En el modelo de bloques aleatorizados que se estudió previamente se supuso que en 
cada bloque se toma una observación de cada tratamiento. Si la suposición del modelo 
es correcta, es decir, si los bloques y los tratamientos son los únicos efectos reales y no 
hay interacción, el valor esperado del cuadrado medio del error es la varianza del error 
experimental o°. Sin embargo, suponga que existe interacción entre los tratamientos y 
los bloques, como lo indica el modelo 


Yi = и + О +p; + (08); + €j 
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de la sección 13.8. El valor esperado del cuadrado medio del error entonces es dado por 


SCE = 1 k b A 
Ё СЕ Е (b— 1)(к — 1) >.) (98. 


i=l ј=1 


Los efectos del tratamiento y los bloques no aparecen en el cuadrado medio del error 
esperado, pero los efectos de la interacción sí. Entonces, si en el modelo hay interacción, 
el cuadrado medio del error refleja variación debida al error experimental más una con- 
tribución de la interacción y, para este plan experimental, no hay forma de separarlos. 


La interacción y la interpretación de los efectos principales 


Desde el punto de vista del experimentador, parecería necesario llegar a una prueba 
significativa sobre la existencia de una interacción, al separar la variación del error ver- 
dadero de aquel que se debe a la interacción. Los efectos principales, A y B, adoptan 
un significado distinto en presencia de la interacción. En el ejemplo biológico anterior 
el efecto que tiene el tiempo de secado sobre la cantidad de sólidos que quedan en la 
levadura muy bien podría depender de la temperatura a la que se expusieron las mues- 
tras. En general, podrían existir situaciones experimentales en las que el factor A tuviera 
un efecto positivo sobre la respuesta en un nivel del factor B; en tanto que con un nivel 
distinto de B el efecto de A sería negativo. Aquí se usa el término efecto positivo para 
indicar que el producto o la respuesta se incrementan conforme los niveles de un factor 
dado aumentan de acuerdo con cierto orden definido. En el mismo sentido, un efecto ne- 
gativo corresponde a una disminución de la respuesta al aumentar los niveles del factor. 

Considere, por ejemplo, los siguientes datos de temperatura (factor A con niveles 1,, 
t, y t (en orden creciente) y tiempo de secado 4, d, y d, (también en orden creciente). 
La respuesta es el porcentaje de sólidos. Estos datos son completamente hipotéticos y se 
dan para ilustrar un aspecto. 


B 
A а, d 4 Total 


tı 44 88 52 184 
t2 75 85 24 184 
t3 97 79 08 184 


Total 216 25.2 84 55.2 


Es evidente que el efecto de la temperatura sobre el porcentaje de sólidos es po- 
sitivo para el tiempo breve de secado d, pero negativo para el tiempo prolongado d,. 
Esta interacción clara entre la temperatura y el tiempo de secado es evidentemente 
interesante para el biólogo; sin embargo, con base en los totales de las respuestas para 
las temperaturas г, t, y t, la suma de cuadrados de la temperatura, SCT, producirá un 
valor de 0. Entonces, se dice que la presencia de la interacción enmascara el efecto de la 
temperatura. Por ello, si se considera el efecto medio de la temperatura, promediado para 
el tiempo de secado, no existe efecto alguno. Entonces, esto define el efecto principal. 
Pero, por supuesto, es probable que esto no sea pertinente para el biólogo. 

Antes de sacar cualquier conclusión final a partir de las pruebas de significancia 
sobre los efectos principales y los efectos de la interacción, el experimentador de- 
bería observar primero si la prueba para la interacción es o no significativa. Si la 
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interacción no es significativa, entonces los resultados de las pruebas sobre los efectos 
principales son importantes. No obstante, si la interacción debe ser significativa, en- 
tonces solamente son importantes aquellas pruebas sobre los efectos principales que 
resultan significativas. En presencia de una interacción, los efectos principales no signi- 
ficativos bien podrían ser resultado de enmascaramiento e indicar la necesidad de obser- 
var la influencia de cada factor a niveles fijos del otro. 


Representación gráfica de la interacción 


La presencia de interacción, así como su impacto científico, se puede interpretar adecua- 
damente usando gráficas de interacción. Las gráficas proporcionan una clara imagen 
de la tendencia de los datos para mostrar el efecto que tiene el cambio de un factor 
conforme se pasa de un nivel a otro del segundo factor. La figura 14.1 ilustra la fuerte 
interacción entre la temperatura y el tiempo de secado. La interacción se revela en las 
líneas no paralelas. 
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Figura 14.1: Gráfica de la interacción para los datos de temperatura y de tiempo 
de secado. 


El efecto relativamente fuerte de la temperatura sobre el porcentaje de sólidos en 
el tiempo de secado más breve se refleja en la marcada pendiente de д. En el tiempo de 
secado medio, d,, la temperatura tiene muy poco efecto, mientras que en el tiempo 
de secado prolongado d, la pendiente negativa indica un efecto negativo de la tempe- 
ratura. Las gráficas de interacción como ésta le permiten al científico hacer una inter- 
pretación rápida y significativa de la interacción que existe. Debe ser evidente que el 
paralelismo en las gráficas indica la ausencia de interacción. 


Necesidad de observaciones múltiples 


En el experimento de 2 factores, la interacción y el error experimental sólo se separan si 
se hacen observaciones múltiples con las distintas combinaciones de tratamiento. Para 
máxima eficiencia debe haber el mismo número n de observaciones para cada combi- 
nación. Éstas deben ser verdaderas réplicas, no sólo medidas repetidas. Por ejemplo, en 
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el caso de la levadura, si para cada combinación de temperatura y tiempo de secado se 
toman n = 2 observaciones, debería haber dos muestras separadas y no sólo mediciones 
repetidas en la misma muestra. Esto permite que la variabilidad debida a las unidades 
experimentales aparezca en el “error”, de manera que la variación no es un simple error 
de medición. 


14.3 Análisis de varianza de dos factores 


Al presentar las fórmulas generales para el análisis de varianza de un experimento de 2 
factores utilizando observaciones repetidas en un diseño completamente aleatorizado, 
debe considerarse el caso de n réplicas de las combinaciones del tratamiento, determi- 
nadas por a niveles del factor A y b niveles del factor B. Las observaciones se podrían 
clasificar usando un arreglo rectangular, donde los renglones representan los niveles 
del factor A y las columnas representan los niveles del factor B. Cada combinación de 
tratamiento define una celda del arreglo. Así, se tienen ab celdas, cada una de las cua- 
les contiene n observaciones. Se denota con Yje la k-ésima observación tomada en el 
i-ésimo nivel del factor A y el j-ésimo nivel del factor B. En la tabla 14.1 se muestran las 
abn observaciones. 


Tabla 14.1: Experimento de dos factores con n réplicas 


B 
A 1 2 ..>. b Total Media 
1 yı У121 э У1һ1 Y. Ji.. 
Y112 Y122 бз Y1b2 
Уил Y12n та» Y1bn 
2 Уи У221 кез Y2b1 Y. J2.. 
Y212 Y222 эш Y2b2 
У21п Yn TR Y2bn 
a Уа11 Ya21 ‚та Уар1 Ya.. Ул: 
Уа12 Ya22 e Yab2 
Yaln Ya2n Eds Yabn 
Total Yı. Үз. e Y», Y 
Media Jı. Y.2. Д Y». ӯ... 


Las observaciones en la celda (1j)-ésima constituyen una muestra aleatoria de ta- 
maño n de una población que se supone tiene distribución normal con media и, y Va- 
rianza o°. Se supone que todas las ab poblaciones tienen la misma varianza o°. Se 
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definen los siguientes símbolos útiles, algunos de los cuales se utilizan en la tabla 14.1: 


Y, = suma de las observaciones en la (ij)-ésima celda, 

Ү = suma de las observaciones para el ¡-ésimo nivel del factor A, 

= suma de las observaciones рага el j-ésimo nivel del factor B, 
= suma de todas las abn observaciones, 

y, = media de las observaciones en la (1/)-ésima celda, 

= media de las observaciones para el ¡-ésimo nivel del factor A, 

y, = media de las observaciones para el j-ésimo nivel del factor B, 

Y = media de todas las abn observaciones. 

A diferencia de la situación para un solo factor, que se cubrió con amplitud en el ca- 
pítulo 13, en éste supondremos que las poblaciones, de las que se toman n observaciones 
independientes con distribución idéntica, son combinaciones de los factores. Asimismo, 
se supondrá siempre que de cada combinación de factores se toma un número igual (л) 


de observaciones. En los casos en que los tamaños de las muestras por combinación son 
desiguales, los cálculos son más complicados, aunque los conceptos son transferibles. 


Modelo e hipótesis para el problema de dos factores 


Cada observación de la tabla 14.1 se puede escribir en la siguiente forma: 
уйк = Hij + Eijks 


donde є, mide las desviaciones de los valores у, observados en la (¿j)-ésima celda a par- 
tir de la media de la población My Si (aß), denota el efecto de la interacción del i-ésimo 
nivel del factor A y el j-ésimo nivel del factor В, о, el efecto del i-ésimo nivel del factor 
A, В, el efecto del ¡-ésimo nivel del factor B, y и la media conjunta, escribimos 


ш =H +0 + 8; + (AB) ij, 


y, entonces, 


Yijk = H + Qi + 8; + (98) + Eijk, 


а las que se imponen las restricciones 


a b 


a b 
Ya =0 У\8 =0 УХ; =0 Yp =0. 


i=l j=1 і=1 j=l 


Las 3 hipótesis por probar son las siguientes: 
1. Hi: а =0 =- = а, = 0, 
Н: Al menos una de las о; no es igual a 0. 


2. Ну: Bi =B = =B =0, 
H;: Al menos una de las 8, no es igual a 0. 


14.3 Análisis de varianza de dos factores 567 


3. Ну: (a) = (а) == =(0)a = 0, 


H, : Al menos una de las (08), no es igual a 0. 


Se alerta al lector acerca del problema del enmascaramiento de los efectos principa- 
les cuando la interacción contribuye de manera importante en el modelo. Se recomienda 
considerar primero el resultado de la prueba de interacción y, luego, la interpretación de 
la prueba del efecto principal; la naturaleza de la conclusión científica depende de si se 
encontró interacción. Si ésta se descarta, entonces se pueden probar las hipótesis 1 y 2 
y la interpretación es muy sencilla. Sin embargo, si se descubre que hay interacción, la 
interpretación puede ser más complicada, como se vio al analizar el tiempo de secado 
y la temperatura en la sección previa. La estructura de las pruebas de hipótesis 1, 2 y 
3 se estudiará en las secciones siguientes. En el análisis del ejemplo 14.1 se incluirá la 
interpretación de los resultados. 

Las pruebas de las hipótesis anteriores se basarán en la comparación de estimados 
independientes de d?, obtenidos al separar la suma de cuadrados total de los datos en 4 
componentes mediante la siguiente identidad. 


Partición de la variabilidad en el caso de dos factores 


Teorema 14.1: Identidad de la suma de cuadrados 


a b n a b 
УЛУ Y On 9.) =bm (у —3..Y +an Y Oy. —Ў.)” 
¡=1 ¡=1 k=1 ¡=1 E] 
a b a b n 
+n DE O =i — 5j. +5.) + Y SE Oi — 9)? 


i=l ј=1 i=l j=1 k=1 
Simbólicamente, la identidad de la suma de cuadrados se escribe como 
SCT = SCA + SCB + SC(AB) + SCE 


donde a SCA y SCB se les denomina la suma de cuadrados para los efectos principales A 
y B, respectivamente, SC(AB) recibe el nombre de suma de cuadrados de la interacción 
para A y B, y SCE es la suma de cuadrados del error. La partición de los grados de liber- 
tad se efectúa de acuerdo con la identidad 


abn — 1 = (а= 1)+ (b— 1) + (a — 1)(Ь— 1) + abín — 1). 


Formación de los cuadrados medios 


Si dividimos cada una de las sumas de cuadrados en el lado derecho de la identidad de 
la suma de cuadrados entre su número correspondiente de grados de libertad, obtenemos 
los cuatro estadísticos 

SCA 2 _ SCB 2 SC(AB) 


P _ $СЕ 
: am b= 5 (= 00е) 


T abn- 1) 


52 = s? 


а—1 


Todos estos estimados de la varianza son estimados independientes de o°, siempre que 
no haya efectos а, В, пі, por supuesto, (ap); Si las sumas de cuadrados se interpretan 
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como funciones de las variables aleatorias independientes у, Уң», У,» No es difícil 
comprobar que 

[SCA b <= 
Е(5?) = Е = 02+" ?, 
[а= 1 4-1 
| SCB 2 na 
E 92 = El == Ж ЕА 
б = е + р ЭЭС 
[| SC(AB) 
Е(52) = Е |——————| =о?+ aß)? , 
Би olla aD- Aa ш 
Г SCE 
Е(52) = Е |——————| =ø, 
15) | abí(n — 5 
a partir de lo cual se observa de inmediato que los 4 estimados de т? son no sesgados 
cuando H4, Ну, y Ну son verdaderas. 
Para probar la hipótesis Н, de que los efectos de los factores A son todos iguales а 
cero, se calcula la siguiente razón: 
Prueba F para 52 
el factor А Л = 2 
que es un valor de la variable aleatoria F, el cual tiene la distribución F con a — 1 y 
ab(n — 1) grados de libertad cuando Н, es verdadera. La hipótesis nula se rechaza al 
nivel de significancia о cuando fı > fala — 1,abín — 1)]. 
De manera similar, para probar la hipótesis H ба de que todos los efectos del factor В son 
iguales a cero, se calcula la razón: 
Prueba F para 52 
el factor В Р = 2? 
que es un valor de la variable aleatoria F, que tiene la distribución F соп b — 1 y 
abí(n — 1) grados de libertad cuando Ho o €S Verdadera. Esta hipótesis se rechaza al nivel 
de significancia œ cuando f2 > falb—1,ab(n—1)]. 
Por último, para probar la hipótesis H бэ de que todos los efectos de interacción son 
iguales a 0, se calcula la razón siguiente: 
Prueba F para s2 
la interacción Ўз = 3» 


que es un valor de la variable aleatoria F,, el cual tiene la distribución F con (a — 1) 
(b — 1) y abín — 1) grados de libertad cuando H, y es verdadera. Concluimos que, a un 
nivel de significancia о, hay interacción cuando ѓо [(а — 1)(Ь— 1), abín — 1)]. 


Сото se indicó еп la sección 14.2, se recomienda interpretar la prueba para la inte- 
racción antes de tratar de hacer inferencias sobre los efectos principales. Si la interacción 
no es significativa, entonces hay evidencia de que las pruebas sobre los efectos principa- 
les son interpretables. El rechazo de la hipótesis 1 de la página 566 implica que las me- 
dias de la respuesta en los niveles del factor A difieren significativamente, mientras que 
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el rechazo de la hipótesis 2 implica una condición similar para las medias en los niveles 
del factor B. Sin embargo, una interacción significativa podría muy bien implicar que los 
datos se deberían analizar de una manera un poco diferente, quizá observando el efecto 
del factor A en niveles fijos del factor B, y así sucesivamente. 

Los cálculos en un problema de análisis de varianza para un experimento de 2 fac- 
tores con n réplicas suelen resumirse como se ilustra en la tabla 14.2. 


Tabla 14.2: Análisis de varianza para el experimento de 2 factores con n réplicas 


Fuente de Suma de Grados de Cuadrado f 
variación cuadrados libertad medio calculada 
Efecto principal 

A SCA а—1 s} = 5©% Ду =} 
В SCB h=1 s3 = 5©8_ f=% 
Interacciones 

de 2 factores 

AB SC(AB)  (a-DO-=D 83 = особу /з=у 
Error SCE ab(n = 1) 82 = FAT 

Total STC арп — 1 


Ејетріо 14.1: |En un experimento realizado para determinar cuál de 3 sistemas de misiles distintos es 


Solución: 


preferible, se midió la tasa de combustión del propulsor para 24 arranques estáticos. Se 
emplearon 4 tipos de combustible diferentes y el experimento generó observaciones du- 
plicadas de las tasas de combustión para cada combinación de los tratamientos. 

Los datos, ya codificados, se presentan en la tabla 14.3. Pruebe las siguientes hipó- 
tesis: а) Нуу; no hay diferencia en las tasas medias de combustión del propulsor cuando 
se emplean diferentes sistemas de misiles, b) H j no existe diferencia en las tasas medias 
de combustión de los 4 tipos de propulsor, c) H A no hay interacción entre los distintos 
sistemas de misiles y los diferentes tipos de propulsor. 


Tabla 14.3: Tasas de combustión del propulsor 


Sistema de Tipo de propulsor 
misiles bi b2 b3 b4 
a 34.0 30.1 29.8 29.0 
327 328 267 28.9 
аз 320 302 287 27.6 
332 298 28.1 27.8 
аз 284 273 297 28.8 


29.3 28.9 27.3 29.1 


1. а) Ho: Ор = Q2 = Q3 = 0); 
b) Ho: Bi =b = 8 = В, = 0. 


с) Hg: (а) 11 = (08) 12 =... = (08)з4 = 0. 
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2. а) Н: Al menos una de las о no es igual a 0. 


b) H;: Al menos una de las В, no es igual a 0. 


с) Н: Al menos una de las (ap); no es igual a 0. 


Se utiliza la fórmula de la suma de cuadrados que se describió en el teorema 14.1. 
En la tabla 14.4 se presenta el análisis de varianza. 


Tabla 14.4: Análisis de varianza para los datos de la tabla 14.3 


Fuente de Suma de Grados de Cuadrado f 
variación cuadrados libertad medio calculada 
Sistema de misiles 14.52 2 7.26 5.84 
Tipo de propulsor 40.08 3 13.36 10.75 
Interacción 22.16 6 3.69 2:97 
Error 14.91 12 1.24 

Total 91.68 23 


Se remite al lector al procedimiento de modelos lineales generales (GLM, por sus 
siglas en inglés) del SAS para el análisis de los datos de la tasa de combustión de la figura 
14.2. Observe la forma en que al principio se prueba el “modelo” (11 grados de libertad), 
y por separado se prueban el sistema, el tipo y el sistema por tipo de interacción. La 
prueba f en el modelo (Р = 0.0030) prueba la acumulación de los 2 efectos principales 


y la interacción. 


a 


= 


Rechace Н y concluya que los distintos sistemas de misiles resultan en diferentes 


tasas medias de combustión del propulsor. El valor P es de aproximadamente 0.0169. 


b 


ме 


Rechace Н е y concluya que las tasas medias de combustión del propulsor no son las 


mismas para los 4 tipos de propulsores. El valor P es de aproximadamente 0.0010. 


c) La interacción es apenas insignificante al nivel 0.05, pero el valor P de aproximada- 
mente 0.0513 indicaría que la interacción debe tomarse en serio. 


En este momento debemos hacer algún tipo de interpretación de la interacción. 
Debe destacarse que la significancia estadística de un efecto principal tan sólo implica 
que las medias marginales son significativamente diferentes. Sin embargo, considere la 
tabla de promedios de 2 factores de la tabla 14.5. 


Tabla 14.5: Interpretación de la interacción 


bi bz b3 b4 Promedio 
а\ 33.35 31.45 28.25 28.95 30.50 
аз 32.60 30.00 28.40 27.70 29.68 
аз 28.85 28.10 28.50 28.95 28.60 
Promedio 31.60 29.85 28.38 28.53 


Es evidente que һау más información importante en el cuerpo de la tabla, tendencias 
que son inconsistentes con la tendencia que describe los promedios marginales. La tabla 
14.5 sugiere con certeza que el efecto del tipo de propulsor depende del sistema que 
se utiliza. Por ejemplo, para el sistema 3, el efecto del tipo de propulsor no parece ser 
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The GLM Procedure 


Dependent Variable: rate 


Source 
Model 
Error 


Corrected 


R-Square 
0.837366 


Source 
system 
type 
system*type 


Sum of 
DF Squares Mean Square F Value Pr > Е 
11 76.76833333 6.97893939 5.62 0.0030 
12 14.91000000 1.24250000 


Total 23 91.67833333 


Coeff Var Root MSE rate Mean 

3.766854 1.114675 29.59167 
DF Type III SS Mean Square F Value PE > E 
14.52333333 7.26166667 5.84 0.0169 
40.08166667 13.36055556 10.75 0.0010 
22.16333333 3.69388889 2.97 0.0512 


Figura 14.2: Salida de resultados del SAS para el análisis de los datos de la tasa 
de combustión del propulsor de la tabla 14.3. 


importante, aunque tiene un efecto grande si se utiliza el sistema 1 o el 2. Esto explica la 
interacción “significativa” entre esos 2 factores. Más adelante se revelará más informa- 
ción acerca de esta interacción. JJ 


Ejemplo 14.2: 


Remítase al ejemplo 14.1 y elija 2 contrastes ortogonales para dividir la suma de cuadra- 
dos del sistema de misiles en componentes con un solo grado de libertad, los cuales 
utilizará para comparar los sistemas 1 y 2 con el 3, y el sistema 1 contra el sistema 2. 


Solución: El contraste para comparar los sistemas 1 y 2 con el 3 es 


ил = Ш. + o. — 2p3.. 


Un segundo contraste, ortogonal a w,, para comparar el sistema 1 con el 2, es dado por 
w, = u, — 1, Las sumas de cuadrados con un solo grado de libertad son 


[244.0 + 237.4 — (2)(228.8)]2 


"95 (SACO? + (1)? + (—2)?] 


= 11.80 


(244.0 — 237.4)? 
A)? + (—1)?] 


Observe que SCw, + SCw, = SCA, como se esperaba. Los valores f calculados corres- 
pondientes a w, y w, son, respectivamente, 


SCw = = 2.72. 


11.80 2.72 


Al comparar con el valor crítico f ¿¿(1, 12) = 4.75, se encuentra que f, es significativo. 
De hecho, el valor P es menor que 0.01. Así, el primer contraste indica que se rechaza la 
hipótesis 
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1 
Ho: 50. + H2.) = Шш. 


Сото f, < 4.75, las tasas medias de combustión del primer y segundo sistemas по son 
significativamente diferentes. 2 


Impacto de Ја interacción significativa en el ejemplo 14.1 


Si la hipótesis de que no hay interacción en el ejemplo 14.1 es verdadera, podríamos 
hacer las comparaciones generales del ejemplo 14.2 relacionado con los sistemas de 
misiles, en lugar de comparaciones separadas para cada propulsor. De manera similar, 
se podrían realizar comparaciones generales entre los propulsores, en vez de comparar 
por separado cada sistema de misiles. Por ejemplo, se podrían comparar los propulsores 
1 y 2 con el 3 y 4, y también el 1 contra el 2. Las razones f resultantes, cada una con 1 y 
12 grados de libertad, resultan ser de 24.81 y 7.39, respectivamente, y ambas son muy 
significativas al nivel 0.05. 

Por los promedios de los propulsores, parece haber evidencia de que el 1 ofrece 
la tasa media de combustión más alta. Un experimentador prudente sería cauteloso al 
sacar conclusiones generales en un problema como éste, donde la razón f de la interac- 
ción está apenas por debajo del valor crítico de 0.05. Por ejemplo, la evidencia general, 
31.60 contra 29.85 sobre el promedio para los 2 propulsores, indica con claridad que el 
1 es superior al 2, en términos de una mayor tasa de combustión. Sin embargo, si nos 
restringimos al sistema 3, donde tenemos un promedio de 28.85 para el propulsor 1 en 
oposición a 28.10 para el propulsor 2, parece haber una diferencia mínima o incluso nin- 
guna entre estos 2 propulsores. De hecho, parece que hay una estabilización de las tasas 
de combustión para los distintos propulsores si se opera con el sistema 3. Es claro que 
existe evidencia general que indica que el sistema 1 ofrece una tasa de combustión más 
alta que el sistema 3, pero parece que esta conclusión no se sostiene si nos restringimos 
al propulsor 4. 

Para recabar evidencias concluyentes de que la interacción está produciendo dificul- 
tades considerables en la obtención de conclusiones generales sobre los efectos prin- 
cipales, el analista puede hacer una prueba 1 sencilla utilizando las tasas de combustión 
promedio del sistema 3. Considere una comparación del propulsor 1 contra el 2 usando 
únicamente el sistema 3. Se toma prestado un estimado de т? del análisis general, es 
decir, se utiliza s? = 1.24 con 12 grados de libertad, y se obtiene 


0.75 0.75 
le] = = =0.67, 
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que no se acerca a ser significativa. Esta ilustración sugiere que, en presencia de inte- 
racción, debería tenerse cautela con la interpretación estricta de los efectos principales. 


Análisis gráfico para el problema de dos factores del ejemplo 14.1 


Muchos de los mismos tipos de ilustraciones gráficas que se sugirió emplear en los 
problemas de un factor también se aplican en el caso de 2 factores. Las gráficas en 
2 dimensiones de las medias de las celdas o de las medias de las combinaciones de 
tratamientos ofrecen información sobre la presencia de interacciones entre los 2 factores. 
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Además, una gráfica de los residuales contra los valores ajustados bien podría indicar 
si se cumple o no la suposición de la varianza homogénea. Por supuesto, es frecuente 
que una violación de la suposición de varianza homogénea implique un aumento en 
la varianza del error conforme los números de la respuesta se vuelven más grandes. 
Como resultado, esta gráfica podría resaltar la violación. 

La figura 14.3 presenta la gráfica de las medias de las celdas para el caso del pro- 
pulsor de los sistemas de misiles del ejemplo 14.1. Observe gráficamente (en este caso) 
cuánta falta de paralelismo hay. Note el aplanamiento de la parte de la figura que indica 
el efecto del propulsor para el sistema 3. Esto ilustra la interacción entre los factores. La 
figura 14.4 muestra la gráfica de los residuales contra los valores ajustados para los mis- 
mos datos. Al parecer no hay dificultades con la suposición de la varianza homogénea. 


34 
32 


30 


Tasa 


28 


26 
Tipo 


Figura 14.3: Gráfica de las medias de las celdas para los datos del ejemplo 14.1. Los 
números representan los sistemas de misiles. 


1.5 


0.5 


Residuales 


—1.5 


Figura 14.4: Gráfica de los residuales de los datos del ejemplo 14.1. 
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Ejemplo 14.3: | 


Solución: 


Un ingeniero eléctrico investiga un proceso de grabado con plasma que se emplea en la 
fabricación de semiconductores. Es de interés estudiar los efectos de 2 factores, la canti- 
dad de flujo (4) del gas C,F, y la potencia aplicada al cátodo (B). La respuesta es la ve- 
locidad de grabado. Cada factor se aplica a 3 niveles y se hacen 2 corridas experimenta- 
les sobre la velocidad de grabado para cada una de las 9 combinaciones. El plan 
representa un diseño completamente aleatorizado. En la tabla 14.6 se presentan los da- 
tos. La velocidad de grabado se expresa en A*/min. 


Tabla 14.6: Datos para el ejemplo 14.3 


Cantidad de flujo Potencia suministrada 
del С.Е, 1 2 3 
1 288 488 670 
360 465 720 
2 385 482 692 
411 521 724 
3 488 595 761 


462 612 801 


Los niveles de los factores están en orden ascendente, donde el nivel 1 es el más 
bajo y el 3 el más alto. 
a) Elabore una tabla de análisis de varianza y saque conclusiones; empiece con la prue- 
ba de interacción. 


b) Haga pruebas sobre los efectos principales y saque conclusiones. 


En la figura 14.5 se muestra una salida de resultados por computadora del SAS. De ese 
listado se concluye lo siguiente. 


Dependent Variable: 


Source 
Model 
Error 
Corrected Total 


The GLM Procedure 


etchrate 
Sum of 
DF Squares Mean Square F Value PE-S E 
379508.7778 47438.5972 61.00 <.0001 
6999.5000 777.7222 


17 386508.2778 


R-Square Coeff Var Root MSE etchrate Mean 
0.981890 5.057714 27.88767 551.3889 
Source DF Type III SS Mean Square F Value Рг> Е 
c2f6 46343.1111 23171.5556 29.79 0.0001 
power 330003.4444 165001.7222 212.16 <.0001 
c2f6*power 4 3162.2222 790.5556 1.02 0.4485 


Figura 14.5: Una salida de resultados por computadora del SAS para el ejemplo 14.3. 


a) El valor P para la prueba de interacción es 0.4485. Se concluye que la interacción no 
es significativa. 


b) Existe una diferencia significativa en la velocidad media de grabado para los 3 nive- 
les de la velocidad de flujo del C,F,. Una prueba de Duncan muestra que la velocidad 
media de grabado para el nivel 3 es significativamente mayor que para el nivel 2, y la 
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velocidad para el nivel 2 es significativamente mayor que para el nivel 1. Véase la 


figura 14.6a. 


Existe una diferencia significativa en la velocidad media de grabado basada en el 
nivel de potencia al cátodo. Una prueba de Duncan revela que la velocidad de graba- 
do para el nivel 3 es significativamente más alta que para el 2, y que la velocidad para 
el nivel 2 es significativamente más alta que para el 1. Véase la figura 14.6b. 


Duncan Grouping Mean N 
A 619.83 6 3 
B 535.83 6 2 
С 498.50 6 1 


(a) 


Duncan Grouping Mean N 
A 728.00 6 3 
B 527.17 6 2 
С 399.00 6 1 


(b) 


power 


Figura 14.6: Una salida de resultados por computadora del SAS para el ejemplo 14.3. a) Prueba de Duncan 
de la cantidad de flujo del gas; b) Prueba de Duncan de la potencia. И | 


Ejercicios 


14.1 Se realizó un experimento para estudiar los efec- 
tos de la temperatura y el tipo de horno sobre la vida 
de un componente en particular. En el experimento se 
utilizaron 4 tipos de horno y 3 niveles de temperatura. 
Se asignaron 24 piezas al azar, 2 para cada combina- 
ción de tratamientos y se registraron los siguientes re- 
sultados. 


Horno 
Temperatura (°F) О, 0 О; 0, 
500 227 214 225 260 
221 259 236 229 
550 187 181 232 246 
208 179 198 273 
600 174 198 178 206 
202 194 213 219 


A un nivel de significancia de 0.05 pruebe las hipótesis 
de que 
a) las diferentes temperaturas no tienen efecto en la 
vida del componente; 
b) los diferentes hornos no tienen efecto en la vida 
del componente; 
c) no hay interacción entre el tipo de horno y la tem- 
peratura. 


14.2 El Departamento de Nutrición Humana y 
Alimentos del Virginia Tech realizó un estudio titulado 
Vitamin С Retention in Reconstituted Frozen Orange 
Juice sobre la estabilidad de la vitamina C en el con- 
centrado de jugo de naranja congelado reconstituido y 
almacenado en un refrigerador durante un periodo de 
hasta una semana. Se probaron 3 tipos de concentrado 
de jugo de naranja congelado en 3 periodos distintos, 
los cuales se refieren al número de días transcurridos 
desde que se mezcló el jugo hasta que se probó. Se 


registraron los resultados en miligramos de ácido as- 
córbico por litro. Utilice un nivel de significancia de 
0.05 para probar las hipótesis de que 

a) no hay diferencias en el contenido de ácido ascór- 
bico entre las diferentes marcas de concentrado de 
jugo de naranja; 

b) no existen diferencias en el contenido de ácido as- 
córbico para distintos periodos; 

c) no hay interacción entre las marcas de concen- 
trado de jugo de naranja y el número de días trans- 
curridos desde que el jugo se mezcló hasta que se 
probó. 


Tiempo (días) 

Marca 0 3 7 
Richfood 52.6 54.2 49.4 49.2 42.7 48.8 
49.8 46.5 42.8 53.2 40.4 47.6 
Sealed-Sweet 56.0 48.0 48.8 44.0 49.2 44.0 
49.6 48.4 44.0 42.4 42.0 43.2 
Minute Maid 52.5 52.0 48.0 47.0 48.5 43.3 
51.8 53.6 48.2 49.6 45.2 47.6 


14.3 Se estudió el desempeño de 3 cepas de ratas en 
una prueba de laberintos en 2 condiciones ambientales 
diferentes. Se registraron las puntuaciones de error de 
las 48 ratas: 


Cepa 

Ambiente Brillante |Mezclada | Torpe 
Libre 28 12 33 83 ТОТ 94 

22 23 36 14 33 56 

25 10 41 76 122 83 

36 86 22 58 35 23 

Restringido 12.32 60 89 136 120 
48 93 35 126 38 153 

25 31 83 110 64 128 

91 19 99 118 87 140 
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Utilice un nivel de significancia de 0.01 para probar las 
hipótesis de que 
a) no hay diferencia en las puntuaciones de error para 
ambientes diferentes; 
b) no existe diferencia en las puntuaciones de error 
para cepas diferentes; 
с) no hay interacción entre los ambientes y las cepas 
de las ratas. 


14.4 La fatiga por corrosión de los metales se define 
como la acción simultánea de tensión cíclica y ataque 
químico sobre una estructura metálica. Una técnica 
muy utilizada para minimizar el daño de la fatiga por 
corrosión en el aluminio requiere la aplicación de un 
recubrimiento protector. En un estudio efectuado por el 
Departamento de Ingeniería Mecánica de Virginia Tech 
se utilizaron 3 niveles diferentes de humedad: 


Bajo: 20 a 25% de humedad relativa 
Medio: 55 a 60% de humedad relativa 
Alto: 86 a 91% de humedad relativa 
y 3 tipos de recubrimiento: 
No revestido: Sin recubrimiento 
Anodizado: Recubrimiento de óxido anódico por 
ácido sulfúrico 
Conversión: Recubrimiento por conversión quí- 
mica de cromato. 


Los datos de fatiga por corrosión, expresados en miles 


de ciclos hasta que se presenta la falla, se registraron 
como sigue: 


Humedad relativa 


Recubrimiento Baja Media Alta 
361 469 | 314 522 | 1344 1216 

No revestido 466 937 | 244 739 | 1027 1097 
1069 1357 | 261 134 | 1011 1011 
114 1032 | 322 471 78 466 

Anodizado 1236 92 | 306 130 | 387 107 


Conversión 


a) Lleve a cabo un análisis de varianza con & = 0.05 
para probar si existen efectos principales y efectos 
de interacción. 

b) Utilice la prueba de Duncan de rango múltiple a 
un nivel de significancia de 0.05 para determinar 
cuáles niveles de humedad relativa dan como re- 
sultado daños distintos de fatiga por corrosión. 


14.5 Para determinar cuáles músculos necesitan so- 
meterse a un programa de acondicionamiento para 
mejorar el rendimiento individual en el servicio ten- 
dido que se usa en el tenis, el Departamento de Salud, 
Educación Física y Recreación de Virginia Tech realizó 
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un estudio de 5 músculos diferentes: 

1: deltoides anterior 4: deltoides medio 

2: pectoral mayor 5: tríceps 

3: deltoides posterior 
los cuales se probaron en cada uno de 3 sujetos; el ex- 
perimento se efectuó 3 veces para cada combinación de 


tratamiento. Los datos electromiográficos que se regis- 
traron durante el servicio se presentan a continuación. 


Músculo 

Sujeto 1 2 з 4 5 
1 32 5 58 10 19 

59 15 61 10 20 

38 2 66 14 23 

2 63 0 64 45 43 

60 9 78 61 61 

50 7 78 71 42 

3 43 41 26 63 6l 


Utilice un nivel de significancia de 0.01 para probar las 
hipótesis de que 
a) diferentes sujetos tienen medidas electromiográfi- 
cas iguales; 
b) los diferentes músculos no tienen un efecto en las 
medidas electromiográficas; 
с) no hay interacción entre los sujetos y los tipos de 
músculos. 


14.6 Se realizó un experimento para determinar si 
los aditivos incrementan la adherencia de productos 
de caucho. Se elaboraron 16 productos con el aditivo 
nuevo y otros 16 sin dicho aditivo. Se registró la si- 
guiente adherencia. 


Temperatura (°C) 
50 60 70 80 
23 34 38 39 
Sin el aditivo 29 37 39 32 
31 36 41 30 
32 32 38 27 
43 38 39 35 
Con el aditivo 39 38 40 36 
39 39 37 38 
42 35 36 39 


Haga un análisis de varianza para probar la existencia 
de efectos principales y de interacción significativos. 


14.7 Se sabe que la velocidad de extracción de cierto 
polímero depende de la temperatura de reacción y de 
la cantidad de catalizador empleada. Se hizo un expe- 
rimento en 4 niveles de temperatura y 5 niveles de ca- 
talizador, y se registró la velocidad de extracción en la 
siguiente tabla: 


Ejercicios 


Cantidad de catalizador 
0.5% 0.6% 07% 0.8% 0.9% 
50°С 38 45 57 59 57 
41 47 59 61 58 
60°С 44 56 70 73 61 
43 57 69 72 58 
70°С 44 56 70 73 61 
47 60 67 61 59 
80°С 49 62 70 62 53 
47 65 55 69 58 


Realice un análisis de varianza. Pruebe si hay efectos 
principales y de interacción significativos. 


14.8 En Myers, Montgomery y Anderson-Cook 
(2009) se estudia un escenario donde se describe un 
proceso de laminado por prensado. La respuesta es el 
espesor del material. Los factores que podrían afectar 
el espesor incluyen la cantidad de níquel (4) y el pH 
(B). Se diseñó un experimento con 2 factores. El plan 
es un diseño completamente aleatorizado en el que las 
prensas individuales se asignan al azar a las combi- 
naciones de factores. En el experimento se utilizan 3 
niveles de pH y 2 niveles de contenido de níquel. Los 
espesores, en cm х 107°, son los siguientes: 


Contenido de pH 
níquel (gramos) 6 5.5 6 


18 250 211 221 
195 172 150 
188 165 170 
10 115 88 69 
165 112 101 
142 108 72 


a) Elabore la tabla del análisis de varianza con prue- 
bas para los efectos principales y de interacción. 
Incluya valores P. 

b) Saque conclusiones para ingeniería. ¿Qué apren- 
dió del análisis de estos datos? 

c) Elabore una gráfica que ilustre la presencia o au- 
sencia de interacción. 


14.9 Un ingeniero está interesado en los efectos de la 
velocidad de corte y la geometría de la herramienta so- 
bre las horas de vida de una máquina-herramienta. Se 
utilizan 2 velocidades de corte y 2 geometrías distintas. 
Se llevan a cabo 3 pruebas experimentales con cada una 
de las 4 combinaciones. Los datos son los siguientes: 
Geometría de Velocidad de corte 


la herramienta Baja Alta 
1 22 28 20 | 34 37 29 
2 18 15 16 | 11 10 10 


a) Calcule la tabla del análisis de varianza con prue- 
bas sobre los efectos principales y de interacción. 

b) Haga comentarios sobre el efecto que tiene la inte- 
racción sobre la prueba de la velocidad de corte. 
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c) Efectúe pruebas secundarias que permitan al inge- 
niero conocer el verdadero impacto de la veloci- 
dad de corte. 

d) Construya una gráfica que ilustre el efecto de inte- 
racción. 


14.10 En un experimento se estudiaron 2 factores de 
un proceso de manufactura de un circuito integrado. El 
propósito del experimento es conocer su efecto sobre la 
resistividad de las obleas de silicio. Los factores son 
la dosis del implante (2 niveles) y la posición de la cal- 
dera (3 niveles). El experimento es costoso, por lo que 
sólo se hizo una corrida con cada combinación. Los da- 
tos son los siguientes. 


Dosis Posición 
1 15.5 14.8 21.3 
2 27.2 24.9 26.1 


Se supone que no hay interacción entre esos 2 factores. 

a) Escriba el modelo y explique sus términos. 

b) Elabore la tabla de análisis de varianza. 

c) Explique los 2 grados de libertad del “error”. 

d) Use una prueba de Tukey para hacer pruebas de 
comparaciones múltiples sobre la posición de la 
caldera. Explique qué es lo que muestran los re- 
sultados. 


14.11 Se realizó un estudio para determinar la in- 
fluencia de 2 factores, el método de análisis y el labo- 
ratorio que hace el análisis, sobre el nivel de contenido 
de azufre del carbón. Se asignaron al azar 28 especí- 
menes de carbón a 14 combinaciones de factores, la 
estructura de las unidades experimentales representada 
por las combinaciones de 7 laboratorios y 2 métodos de 
análisis con 2 especímenes por combinación de facto- 
res. Los datos, expresados en porcentaje de azufre, son 
los siguientes. 


Método 
Laboratorio 1 2 
1 0.109 0.105 | 0.105 0.108 
2 0.129 0.122 | 0.127 0.124 
3 0.115 0.112 | 0.109 0.111 
4 0.108 0.108 | 0.117 0.118 
5 0.097 0.096 | 0.110 0.097 
6 0.114 0.119 | 0.116 0.122 
7 0.155 0.145 | 0.164 0.160 


(Los datos se tomaron de G. Taguchi, “Signal to Noise 
Ratio and Its Applications to Testing Material”, Reports 
of Statistical Application Research, Union of Japanese 
Scientists and Engineers, Vol. 18, Núm. 4, 1971). 


a) Haga un análisis de varianza y exprese los resulta- 
dos en la tabla correspondiente. 

b) ¿Es significativa la interacción? Si lo es, analice lo 
que significa para el científico. Utilice un valor P 
en sus conclusiones. 
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c) ¿Son estadísticamente significativos los efectos 
principales individuales, el laboratorio y el mé- 
todo de análisis? Analice la información y lo que 
aprendió y base su respuesta en el contexto de 
cualquier interacción significativa. 

d) Dibuje una gráfica de interacción que ilustre el 
efecto de la interacción. 

e) Efectúe una prueba para comparar los métodos 1 y 
2 en el laboratorio 1, y haga lo mismo para el labo- 
ratorio 7. Comente lo que revelan esos resultados. 


14.12 En un experimento efectuado en el departa- 
mento de Ingeniería Civil de Virginia Tech se observó 
el crecimiento que cierto tipo de alga tenía en el agua, 
en función del tiempo y la dosis de cobre que se agre- 
gaba al líquido. Los datos se presentan a continuación. 
La respuesta se expresa en unidades de algas. 


Tiempo en días 


Cobre 5 12 18 
1 0.30 0.37 0.25 
0.34 0.36 0.23 
0.32 0.35 0.24 
2 0.24 0.30 0.27 
0.23 0.32 0.25 
0.22 0.31 0.25 
3 0.20 0.30 0.27 
0.28 0.31 0.29 
0.24 0.30 0.25 
a) Haga un análisis de varianza y elabore la tabla co- 
rrespondiente. 


b) Comente acerca de si los datos son suficientes para 
mostrar un efecto del tiempo sobre la concentra- 
ción de algas. 

c) Haga lo mismo para el contenido de cobre. ¿El ni- 
vel de contenido de cobre tiene algún efecto sobre 
la concentración de algas? 

d) Comente los resultados de la prueba de interac- 
ción. ¿Cómo influye el tiempo sobre el efecto del 
contenido de cobre? 


14.13 En Classical and Modern Regression with 
Applications (Duxbury Classic Series, 2a. ed., 1990), 
de Myers, se describe un experimento en el que la 
Agencia de Protección Ambiental busca determinar el 
efecto de 2 métodos de tratamiento de aguas sobre la 
absorción del magnesio. Se miden los niveles de mag- 
nesio, en gramos por centímetro cúbico (cc) y se incor- 
poran 2 niveles diferentes de tiempo al experimento. 
Los datos son los siguientes: 


Tratamiento 
1 2 
1 2.19 2.15 2.16 | 2.03 2.01 2.04 
2 2.01 2.03 2.04 | 1.88 1.86 1.91 


a) Dibuje una gráfica de la interacción. ¿Cuál es su 
impresión? 


Tiempo (horas) 
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b) Efectúe un análisis de varianza y presente pruebas 
para los efectos principales y de interacción. 

c) Mencione los hallazgos científicos acerca de cómo 
influyen el tiempo y el tratamiento en la absorción 
del magnesio. 

d) Ajuste el modelo de regresión adecuado usando el 
tratamiento como variable categórica. Incluya la 
interacción en el modelo. 

e) ¿La interacción es significativa en el modelo de 
regresión? 


14.14 Considere los datos del ejercicio 14.12 y res- 
ponda las siguientes preguntas. 

a) Ambos factores, el cobre y el tiempo, son cuanti- 
tativos. Como resultado, podría ser de interés un 
modelo de regresión. Describa cuál sería un mo- 
delo adecuado si se usa x, = contenido de cobre 
y x, = tiempo. Ajuste el modelo a los datos mos- 
trando los coeficientes de regresión y haga una 
prueba f рага cada uno. 

b) Ajuste el modelo 


Y = Bo + Bixı + 8х + Br2x1x2 
+Bux1 + Bax5 + є, 


у compárelo con el que eligió en el inciso а. ¿Cuál 
Я : пне 3 
es más apropiado? Como criterio utilice R 


ajus * 
14.15 El propósito del estudio The Incorporation of 
a Chelating Agent into a Flame Retardant Finish of a 
Cotton Flannelette and the Evaluation of Selected 
Fabric Properties, llevado a cabo en Virginia Tech, fue 
evaluar el uso de un agente quelante como parte del 
acabado retardante del fuego de la franela de algodón, 
determinando sus efectos en la inflamabilidad después 
de lavar la tela en condiciones específicas. Se utilizaron 
2 tratamientos con 2 niveles; se prepararon 2 baños, uno 
con celulosa de carboximetilo (baño I) y otro sin ella 
(baño ID). La mitad de la tela se lavó 5 veces y la otra 
mitad se lavó 10 veces. Hubo 12 pedazos de tela en cada 
combinación de baño/número de lavados. Después de 
los lavados se midieron las longitudes quemadas de la 
tela, así como los tiempos de combustión. Se registraron 
los siguientes tiempos de combustión (en segundos): 


Lavados Baño I Baño П 

5 13.7 23.0 157| 62 54 50 

25.5 15.8 148| 44 50 33 

140 294 97 |160 2.5 1.6 

140 123 123| 39 25 7.1 

10 272 16.8 12.9 | 18.2 88 145 

149 17.1 13.0 | 147 17.1 13.9 

10.8 135 25.5 | 106 5.8 73 

142 274 11.5 | 17.7 183 9.9 


а) Realice un análisis de varianza. ¿Existe un tér- 
mino de interacción significativo? 

b) ¿Se encontraron diferencias en los efectos princi- 
pales? Analice la información. 
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14.4 Experimentos de tres factores 


En esta sección consideramos un experimento con 3 factores, A, B y C, en los niveles a, 
b y c, respectivamente, en un diseño experimental completamente aleatorizado. Suponga 
de nuevo que se tienen n observaciones para cada una de las abc combinaciones de tra- 
tamientos. Debemos proceder a realizar las pruebas de significancia para los 3 efectos 
principales y las interacciones implicadas. Se espera que el lector podrá utilizar después 
esta descripción para generalizar el análisis a k > 3 factores. 


Modelo para el 
experimento de 
tres factores 


El modelo para el experimento de 3 factores es 
Yik = + О + 8; + 7 + (08); + (а) + (87) + (087) ix + Eijk 


== A „йуу E рУ A N ES 2n ndonde а, Ву Ye 
son los efectos principales y (AB), (оу) У (BN; son los efectos de la interacción de 
2 factores que tienen la misma interpretación que en el experimento con 2 factores. 


El término (087), se denomina efecto de interacción de 3 factores, y representa la 
no aditividad de las (ap); sobre los diferentes niveles del factor C. Igual que antes, 
la suma de todos los efectos principales es igual a 0, y la suma sobre cualesquiera de los 
subíndices de los efectos de la interacción entre 2 y 3 factores es igual a 0. En muchas 
situaciones experimentales estas interacciones de orden superior son insignificantes y 
sus cuadrados medios sólo reflejan variación aleatoria; pero se debe describir el análisis 
en su forma más general. 

Nuevamente, para realizar pruebas válidas de significancia debe suponerse que los 
errores son valores de variables aleatorias independientes y con distribución normal, 
cada una con media igual a 0 y varianza común 0°. 

La filosofía general respecto al análisis es la misma que la que se estudió para los 
experimentos de 1 y 2 factores. La suma de cuadrados se divide en 8 términos, donde 
cada uno representa una fuente de variación de los que se obtienen estimados inde- 
pendientes de т? cuando todos los efectos principales y de la interacción son iguales 
a 0. Si los efectos de cualquier factor dado o interacción no son iguales a 0, entonces 
el cuadrado medio estimará la varianza del error más un componente debido al efecto 
sistemático en cuestión. 


Suma de 
cuadrados para 
un experimento 
de tres factores 


SCA =bcn Y (у. —3..Y? 5С(АВ)=сп Y у (фу — di. —УЎу +9.) 
i=l i j 
b 

SCB =асп X (уу —5... Y SC(AC) =bn 2,2 Gu =J dk +.) 


j=l 


SCC = abn Do —5..)? SC(BC)=an ZO =j Ja. +.) 
j 


SC(ABC) =n D = ўр. ў. ја HI HIj HII) 


STC = 9 > y Som = ў.) SCE = 5 5 5 5 (убы = Ji)? 
i j k 1 i j k 1 
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Aunque en esta sección hacemos énfasis en la interpretación de una salida de resul- 
tados por computadora con comentarios, en vez de preocuparnos por cálculos laboriosos 
de sumas de cuadrados, ofrecemos lo siguiente como la suma de cuadrados para los 3 
efectos principales y las interacciones. Observe la evidente extensión del problema de 2 
factores a uno de 3. 

Los promedios en las fórmulas se definen como sigue: 

Y = promedio de todas las арсп observaciones, 


= promedio de las observaciones para el ¡-ésimo nivel del factor A, 


y, = = promedio de las observaciones para el ¡-ésimo nivel del factor В, 
Y , = promedio de las observaciones para el k-ésimo nivel del factor C, 
Y. = promedio de las observaciones para el ¡-ésimo nivel de A y el j-ésimo nivel de В, 
J,„ = promedio de las observaciones para el ¡-ésimo nivel de A y el k-ésimo nivel de С, 


, = promedio de las observaciones para el j-ésimo nivel de В y el k-ésimo nivel de С, 


Al 


„ = promedio de las observaciones para la (1jk)-ésima combinación de tratamientos. 


x 


Los cálculos en una tabla de análisis de varianza para un problema de 3 factores 
con n réplicas de corridas para cada combinación de factores se resumen en la tabla 14.7. 


Tabla 14.7: ANOVA para el experimento de 3 factores con n réplicas 


Fuente de Suma de Grados de Cuadrado f 
variación cuadrados libertad medio calculada 
Efecto principal: 
A SCA a—=1 si Лу =} 
2 
В SCB b—1 82 Р = 2 
2 
C SCC с—1 53 f=3 
Interacción de 2 factores: 
AB SC(AB) (а — 1)(Ь— 1) 87 Ја = ч 
АС SC(AC) (а= 1)(с– 1) 52 Ј5 = 5 
ВС SC(BC) (b—= 1)(с— 1) 82 /6 = 4 
Interacción de 3 factores: 
ABC SC(ABC) (a—1)X(b—1)(c— 1) 82 7з = У. 
Error SCE abc(n—1) s? 
Total STC абсп—1 


Рага el experimento de 3 factores con una sola corrida experimental por combina- 
ción se podría utilizar el análisis de la tabla 14.7 con n = 1 y usando la suma de cua- 
drados de la interacción ABC para SCE. En este caso suponemos que los efectos de la 


interacción (087), son todos iguales а cero, de modo que 


SC(ABC) S 
(а — DE-Dc-D ta- E 210 3 y api = =o 


i=1 j=1 k=1 
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Es decir, SC(ABC) representa la variación que sólo se debe al error experimental. Por lo 
tanto, su cuadrado medio proporciona un estimado no sesgado de la varianza del error. 
Con п = 1 y SCE = SC(ABC), la suma de cuadrados del error se obtiene restando la 
suma de cuadrados de los efectos principales y las interacciones de 2 factores a la suma 
de cuadrados total. 


Ejemplo 14.4: |En la producción de un material en particular hay 3 variables de interés: A, el efecto del 
operador (3 operadores): B, el catalizador utilizado en el experimento (3 catalizadores); 
y C, el tiempo de lavado del producto después del proceso de enfriamiento (15 minutos y 
20 minutos). Se realizaron 3 corridas con cada combinación de factores. Se consideró 
que debían estudiarse todas las interacciones entre los factores. En la tabla 14.8 se pre- 
sentan los productos codificados. Realice un análisis de varianza para probar si existen 
efectos significativos. 


Tabla 14.8: Datos para el ejemplo 14.4 


Tiempo de lavado, С 
15 minutos 20 minutos 
Catalizador, B Catalizador, B 
Operador, A 1 2 3 1 2 3 
1 10.7 103 11.2 | 109 10.5 12.2 


108 10.2 116 | 12.1 11.1 11.7 
113 105 12.0 | 115 103 11.0 
2 114 102 10.7 | 98 12.6 10.8 
118 109 10.5 | 113 75 102 
115 105 102 | 109 99 11.5 
3 136 120 11.1 | 107 10.2 11.9 
141 116 11.0 | 11.7 115 11.6 
145 115 11.5 | 127 109 12.2 


Solución: La tabla 14.9 muestra el análisis de varianza de los datos. Ninguna de las interacciones 
muestra un efecto significativo a un nivel œ = 0.05. Sin embargo, el valor Р para BC es 
0.0610, de modo que по debe ignorarse. Los efectos del operador y el catalizador son 
significativos, en tanto que el del tiempo de lavado no lo es. 


Impacto de la interacción BC 


Se deben analizar otros aspectos del ejemplo 14.4, en particular acerca del manejo del 
efecto que la interacción entre el catalizador y el tiempo de lavado tienen sobre la prueba 
del efecto principal del tiempo de lavado (factor C). Recuerde el análisis de la sección 
14.2. Se proporcionaron ejemplos de la manera en que la presencia de la interacción 
podría cambiar la interpretación que se da a los efectos principales. En el ejemplo 14.4 
la interacción BC es significativa aproximadamente al nivel 0.06. No obstante, suponga 
que se obtiene una tabla de medias de 2 factores como la 14.10. 

Queda claro por qué el tiempo de lavado no fue significativo. Un analista poco 
cuidadoso se quedaría con la impresión de que el tiempo de lavado podría eliminarse 
de cualquier estudio futuro en el que se mida el producto. Sin embargo, es notorio cómo 
cambia el efecto del tiempo de lavado de uno negativo para el primer catalizador, a lo 


582 Capítulo 14 Experimentos factoriales (dos o más factores) 


Tabla 14.9: ANOVA para un experimento de 3 factores en un diseño completamente aleatorizado 


Fuente gl Suma de cuadrados Cuadrado medio ValorF Valor P 
A 2 13.98 6.99 11.64 0.0001 
B 2 10.18 5.09 8.48 0.0010 
AB 4 4.17 1.19 1.99 0.1172 
C 1 1.19 1.19 1.97 0.1686 
AC 2 2.91 1.46 2.43 0.1027 
BC 2 3.63 1.82 3.03 0.0610 
ABC 4 4.91 1.23 2.04 0.1089 
Error 36 21.61 0.60 

Total 53 63.19 


Tabla 14.10: Tabla de medias de 2 factores para el ejemplo 14.4 


Tiempo de lavado, С 
Catalizador, B 15 min 20 min 
1 12.19 11.29 
2 10.86 10.50 
3 11.09 11.46 
Medias 11.38 11.08 


que parece ser un efecto positivo para el tercer catalizador. Si sólo nos concentramos en 
los datos para el catalizador 1, una comparación simple entre las medias de los 2 tiempos 
de lavado produciría un estadístico f sencillo: 


j= 12.19 — 11.29 


al, EA 
\/0.6(2/9) 


que es significativo a un nivel menor que 0.02. Así, bien podría ignorarse un importante 
efecto negativo del tiempo de lavado para el catalizador 1 si el analista hace la interpre- 
tación general incorrecta de la razón F insignificante del tiempo de lavado. 


Agrupamiento en modelos multifactoriales 


El modelo de 3 factores y su análisis se describió de la manera más general mediante 
la inclusión en el modelo de todas las interacciones posibles. Por supuesto, hay muchas 
situaciones en las que a priori se sabe que el modelo no debería contener ciertas interac- 
ciones. Así, es posible aprovechar este conocimiento al combinar o agrupar las sumas 
de cuadrados correspondientes a interacciones despreciables con la suma de cuadrados 
del error para formar un nuevo estimador de т? con un número más grande de grados de 
libertad. Por ejemplo, en un experimento de metalurgia diseñado para estudiar el efecto 
de 3 variables importantes del proceso sobre el espesor de película, suponga que se sabe 
que el factor A, la concentración de ácido, no interactúa con los factores В y С. Las 
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Tabla 14.11: ANOVA sin interacción del factor A 


Fuente de Suma de Grados de Cuadrado / 
variación cuadrados libertad medio calculada 


Efecto principal: 


= 
-N 


A SCA a=1 sî fi= 3 
B SCB b=1 s2 f=2 
С sec с-1 s З= $ 
Interacción de 2 factores: 
BC SC(BC)  (b=IXc=D 5 = 
Error SCE Resta s? 
Total STC abcn —1 


sumas de cuadrados SCA, SCB, SCC y SC(BC) se calculan usando los métodos descri- 
tos en un apartado anterior de esta sección. Todos los cuadrados medios de los efectos 
restantes ahora estimarán de manera independiente la varianza del error o°. Por lo tanto, 
formamos el nuevo cuadrado medio del error agrupando SC(AB), SC(AC), SC(ABC) 
y SCE junto con los grados de libertad correspondientes. El denominador resultante de 
las pruebas de significancia es, entonces, el cuadrado medio del error dado por 


Zo SC(AB) + SC(AC) + SC(ABC) + SCE 
(а= 1)(Б—1)+(а— 1)(с 0 + (а – 00 — 0(с — 1) + abe(n— 1) ` 


Por supuesto, con una resta se obtienen la suma de cuadrados agrupada y los grados de 
libertad agrupados, una vez que se calcula la STC y las sumas de cuadrados para los efec- 
tos existentes. La tabla del análisis de varianza adoptaría así la forma de la tabla 14.11. 


Experimentos factoriales en bloques 


En este capítulo se ha supuesto que el diseño experimental utilizado es un diseño comple- 
tamente aleatorizado. Al interpretar los niveles del factor A en la tabla 14.11 como blo- 
ques diferentes se tiene el procedimiento del análisis de varianza para un experimento 
de 2 factores en un diseño de bloques aleatorizados. Por ejemplo, si se interpretan los 
operadores del ejemplo 14.4 como bloques, y se supone que no hay interacción entre 
los bloques y los otros 2 factores, el análisis de varianza adopta la forma de la tabla 14.12, 
en vez de la de la tabla 14.9. El lector puede verificar que el cuadrado medio del error 
también es 


g 4774+291 + 4.91 + 21.61 
Иа 4+2+4+36 


= 0.74, 


lo que demuestra el agrupamiento de las sumas de cuadrados рага los efectos de la inte- 
racción inexistente. Observe que el factor B, el catalizador, tiene un efecto significativo 
sobre el producto. 
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Tabla 14.12: ANOVA para un experimento de 2 factores en un diseño de bloques aleatorizados 


Fuente de Suma de Grados de Cuadrado f 
variación cuadrados libertad medio calculada Valor P 
Bloques 13.98 2 6.99 
Efecto principal: 
B 10.18 2 5.09 6.88 0.0024 
C 1.18 1 1.18 1.59 0.2130 
Interacción de 2 factores 
BC 3.64 2 1.82 2.46 0.0966 
Error 34.21 46 0.74 
Total 63.19 53 


Ejemplo 14.5: | Se realizó un experimento para determinar los efectos de la temperatura, la presión y la 


intensidad de agitación sobre la tasa de filtración del producto. Esto se hizo en una plan- 
ta piloto. El experimento se corrió en 2 niveles de cada factor. Además, se decidió que 
debían utilizarse 2 lotes de materia prima, los cuales fueron tratados como bloques. Se 
hicieron 8 corridas experimentales en orden aleatorio para cada lote de materia prima. 
Se piensa que todas las interacciones de los 2 factores podrían ser de interés. No se su- 
pone que haya interacciones con los lotes. Los datos aparecen en la tabla 14.13. Las le- 
tras “B” y “A” implican niveles bajo y alto, respectivamente. La tasa de filtración se ex- 
presa en galones por hora. 

a) Elabore la tabla ANOVA completa. Agrupe todas las “interacciones” con los bloques 

dentro del error. 


b) ¿Cuáles interacciones parecen ser significativas? 


c) Construya gráficas que revelen las interacciones significativas e interprételas. Expli- 
que el significado de la gráfica para el ingeniero. 


Tabla 14.13: Datos para el ejemplo 14.5 


Lote 1 
Tasa de agitación baja Tasa de agitación alta 
Temp. Presión B Presión A Temp. Presión B Presión A 
B 43 49 B 44 47 
A 64 68 A 97 102 
Lote 2 
Tasa de agitación baja Tasa de agitación alta 
Temp. Presión B Presión A Temp. Presión B Presión A 
B 49 57 B 51 55 


A 70 76 A 103 106 
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Solución: a) En la figura 14.7 se presenta una salida de resultados impresos por computadora del 
SAS. 

b) Como se aprecia en la figura 14.7, la interacción de la temperatura con la tasa de 
agitación (strate) parece ser muy significativa. Asimismo, la interacción de la presión 
con la tasa de agitación también parece ser significativa. A propósito, si se hicieran 
más agrupamientos al combinar las interacciones insignificantes con el error, las con- 
clusiones serían las mismas y el valor P para la interacción de la presión con la tasa 
de agitación se volvería más fuerte, a saber, 0.0517. 


c) Como se aprecia en la figura 14.7, los efectos principales tanto de la tasa de agitación 
como de la temperatura son muy significativos. Un vistazo a la gráfica de interacción 
de la figura 14.8a revela que el efecto de la tasa de agitación depende del nivel de la 
temperatura. Con la temperatura baja el efecto de la tasa de agitación es despreciable, 
mientras que con la temperatura alta la tasa de agitación tiene un efecto positivo 
fuerte sobre la tasa media de filtración. En la figura 14.8b la interacción entre la pre- 
sión y la tasa de agitación, aunque no de manera tan pronunciada como la de 
la figura 14.8a, todavía muestra una ligera inconsistencia del efecto de la tasa 


de agitación a través de la presión. JJ 
Source Dr Type ІІІ SS Mean Square F Value Pr > F 
batch 1 175.562500 175.562500 177.14 <.0001 
pressure 1 95.062500 95.062500 95.92 <.0001 
temp 1 5292.562500 5292.562500 5340.24 <.0001 
pressure*temp 1 0.562500 0.562500 0.57 0.4758 
strate 1 1040.062500 1040.062500 1049.43 <.0001 
pressure*strate 1 5.062500 5.062500 5.11 0.0583 
temp*strate 1 1072.562500 1072.562500 1082.23 <.0001 
pressure*temp*strate 1 1.562500 1.562500 1.58 0.2495 
Error 7 6.937500 0.991071 
Corrected Total 15 7689.937500 
Figura 14.7: ANOVA para el ejemplo 14.5, interacción del lote agrupado con el error. 
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Figura 14.8: Gráficas de interacción para el ejemplo 14.5. 
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Ejercicios 


14.16 Considere una situación experimental que im- 
plique los factores A, B y C, en la que se supone un 
modelo de efectos fijos de 3 factores de la forma у = 
L +a, + 8, + 7, + (87), + Enr Se considera que 
todas las demás interacciones по existen o son despre- 
ciables. Los datos se presentan en seguida. 


B; В» 
Ci C Сз | С, C С» 
A1 40 34 39|44 3.1 3.1 
49 41 4.3 | 34 3.5 3.7 
А, 36 28 31| 27 29 3.7 
39 32 3.5 |30 32 42 
Аз 48 33 36|36 29 29 
37 38 42|38 3.3 3.5 
А4 36 32 32122 29 3.6 
39 28 34 |35 32 43 


а) Haga una prueba de significancia sobre la interac- 
ción BC al nivel œ = 0.05. 

b) Desarrolle pruebas de significancia sobre los efec- 
tos principales А, В y C usando un cuadrado medio 
del error agrupado, con un nivel œ = 0.05. 


14.17 Los siguientes datos son medidas de un expe- 
rimento donde se usaron 3 factores, A, B y C, todos de 
efectos fijos. 


Сі С2 Сз 
Bı В Вз | Bı В Вз | Bı В, Вз 
A1 15.0 14.8 15.9 | 16.8 14.2 13.2 | 15.8 15.5 19.2 
18.5 13.6 14.8 | 15.4 12.9 11.6 | 14.3 13.7 13.5 
22.1 12.2 13.6 | 143 13.0 10.1 | 130 12.6 11.1 
А» 11.3 17.2 16.1 | 18.9 15.4 124 | 12.7 17.3 7.8 
14.6 15.5 14.7 | 17.3 17.0 13.6 | 142 15.8 11.5 
18.2 14.2 13.4 | 16.1 18.6 15.2 | 15.9 14.6 12.2 


a) Haga pruebas de significancia sobre todas las inte- 
racciones a un nivel œ = 0.05. 

b) Realice pruebas de significancia sobre los efectos 
principales a un nivel œ = 0.05. 

c) Dé una explicación de la forma en que una interac- 
ción significativa enmascara el efecto del factor C. 


14.18 El método de fluorescencia por rayos X es 
una herramienta analítica importante para determinar 
la concentración de material en los propulsores sóli- 
dos para misiles. En el artículo An X-ray Fluorescence 
Method for Analyzing Polybutadiene Acrylic Acid 
(PBAA) Propellants (Quarterly Report, RK-TR-62-1, 
Army Ordinance Missile Command, 1962), se afirma 
que el proceso de mezcla del propulsor y el tiempo de 
análisis influyen en la homogeneidad del material y, 
por lo tanto, en la precisión de las mediciones de la 
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intensidad de los rayos X. Se hizo un experimento utili- 
zando 3 factores: A, las condiciones de mezcla (4 nive- 
les); B, el tiempo de análisis (2 niveles); y C, el método 
de carga del propulsor en los recipientes para muestras 
(temperatura elevada y de la habitación). Se obtuvieron 
los datos siguientes, que representan el porcentaje de 
peso del perclorato de amoniaco en un propulsor dado. 


Método de carga, С 
Caliente__ | Temp. de la hab. 
A В, B2 Bi B2 
1 38.62 38.45 | 39.82 39.82 
37.20 38.64 | 39.15 40.26 
38.02 38.75 | 39.78 39.72 
2 37.67 37.81 | 39.53 39.56 
37.57 37.75 | 39.76 39.25 
37.85 37.91 | 39.90 39.04 
3 37.51 37.21 | 39.34 39.74 
37.74 37.42 | 39.60 39.49 
37.58 37.79 | 39.62 39.45 
4 37.52 37.60 | 40.09 39.36 
37.15 37.55 | 39.63 39.38 
37.51 37.91 | 39.67 39.00 


a) Realice un análisis de varianza con а = 0.01 рага 
probar la existencia de efectos principales y de in- 
teracción significativos. 

b) Analice la influencia de los 3 factores sobre el 
porcentaje de peso del perclorato de amoniaco. In- 
cluya en su análisis el papel que desempeña cual- 
quier interacción significativa. 


14.19 La fatiga por corrosión de los metales se ha de- 
finido como la acción simultánea de tensión cíclica y 
ataque químico sobre una estructura metálica. En el es- 
tudio Effect of Humidity and Several Surface Coatings 
on the Fatigue Life of 2024-T351 Aluminum Alloy, 
realizado por el Departamento de Ingeniería Mecánica 
de Virginia Tech, se utilizó una técnica que requería la 
aplicación de un recubrimiento protector de cromato 
para minimizar el daño de la fatiga por corrosión en el 
aluminio. En la investigación se emplearon 3 factores 
con 5 réplicas para cada combinación de tratamientos: 
recubrimiento, en 2 niveles; humedad y esfuerzo cor- 
tante, ambos en 3 niveles. A continuación se presentan 
los datos de fatiga expresados en miles de ciclos antes 
de la falla. 

a) Realice un análisis de varianza con @ = 0.01 para 
probar la existencia de efectos principales y de in- 
teracción significativos. 

b) Haga una recomendación para las combinaciones 
de los 3 factores que producirían poco daño por 
fatiga. 


Ejercicios 


Esfuerzo cortante (psi) 


Recubrimiento | Humedad 13,000 17,000 20,000 
Bajo 4580 5252 361 
recubrimiento | (20-25% RH) 10,126 897 466 
1341 1465 1069 

6414 2694 469 

3549 1017 937 

Medio 2858 799 314 
(50-60% RH) 8829 3471 244 
10,914 685 261 

4067 810 522 

2595 3409 739 

Alto 6489 1862 1344 
(86-91% RH) 5248 2710 1027 
6816 2632 663 

5860 2131 1216 

5901 2470 1097 

Сготаао Вајо 5395 4035 130 
(20-25% RH) 2768 2022 841 
1821 914 1595 

3604 2036 1482 

4106 3524 529 

Medio 4833 1847 252 
(50-60% RH) 7414 1684 105 
10,022 3042 847 

7463 4482 874 

21,906 996 755 

Alto 3287 1319 586 
(86-91% RH) 5200 929 402 
5493 1263 846 

4145 2236 524 

3336 1392 751 


14.20 Para un estudio de la dureza de los empastes 
dentales de oro se eligieron 5 dentistas al azar y se asig- 
naron a combinaciones de 3 métodos de condensación 
y 2 tipos de oro. Se midió la dureza. (Véase Hoaglin, 
Mosteller y Tukey, 1991). Permita que los dentistas 
desempeñen el papel de bloques. Los datos se presen- 
tan a continuación. 
a) Proponga el modelo adecuado con las suposiciones. 
b) ¿Hay una interacción significativa entre el método 
de condensación y el tipo de material de empaste 
de oro? 
c) ¿Hay un método de condensación que parezca me- 
jor? Explique su respuesta. 


Tipo 

Dentista Método Lámina dorada Goldent 
1 1 792 824 
2 712 712 

3 782 803 

2 1 803 803 
2 752 772. 

3 715 707 

(cont.) 
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Tipo 
Dentista Método Lámina dorada Goldent 
3 1 715 724 
2 792 715 
3 762 606 
4 1 673 946 
2 657 743 
3 690 245 
5 1 634 715 
2 649 724 
3 724 627 


14.21 Las copiadoras electrónicas funcionan adhi- 
riendo tinta negra al papel mediante electricidad está- 
tica. La etapa final del proceso de copiado comprende 
el calentamiento y adhesión de la tinta sobre el papel. 
La potencia de la adhesión durante este proceso final 
determina la calidad de la copia. Se plantea que la tem- 
peratura, el estado superficial de la adhesión en el ro- 
dillo y la dureza del rodillo de la prensa influyen en la 
potencia de adhesión de la copiadora. Se hizo un expe- 
rimento con tratamientos, que consistían en una combi- 
nación de estos 3 factores en cada uno de 3 niveles. Los 
datos siguientes muestran la potencia de la adhesión 
para cada combinación de tratamientos. Lleve a cabo 
un análisis de varianza con @ = 0.05 para probar si hay 
efectos principales y de interacción significativos. 


Estado 
superficial Ар Dureza del rodillo 
de la adhesión de la prensa 
en el rodillo 20 40 60 
Temp. Suave 0.52 0.44/0.54 0.52|0.60 0.55 
baja 0.57 0.53|0.65 0.56 |0.78 0.68 
Medio 0.64 0.59 [0.79 0.73 |0.49 0.48 
0.58 0.64 [0.79 0.78 [0.74 0.50 
Duro 0.67 0.77 [0.58 0.68 |0.55 0.65 
0.74 0.65 [0.57 0.59 |0.57 0.58 
Temp. Suave 0.46 0.40 [0.31 0.49 |0.56 0.42 
media 0.58 0.37 [0.48 0.66|0.49 0.49 
Medio 0.60 0.43 [0.66 0.57 |0.64 0.54 
0.62 0.61 [0.72 0.56 [0.74 0.56 
Duro 0.53 0.65 [0.53 0.45|0.56 0.66 
0.66 0.56 [0.59 0.47 0.71 0.67 
Temp. Suave 0.52 0.44 [0.54 0.52|0.65 0.49 
ака 0.57 0.53 [0.65 0.56 [0.65 0.52 
Medio 0.53 0.65 [0.53 0.45 |0.49 0.48 
0.66 0.56 [0.59 0.47 [0.74 0.50 
Duro 0.43 0.43|0.48 0.31 |0.55 0.65 
0.47 0.44 [0.43 0.27 (0.57 0.58 


14.22 Considere el conjunto de datos del ejercicio 
14.21. 

a) Construya una gráfica de la interacción para cual- 
quier interacción de 2 factores que sea significa- 
tiva. 

b) Dibuje una gráfica de probabilidad normal de resi- 
duales y coméntela. 
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14.23 Considere combinaciones de 3 factores en el 
retiro de la suciedad de cargas estándar de lavandería. 
El primer factor es la marca del detergente: X, Y o Z. 
El segundo factor es el tipo de detergente: líquido o 
en polvo. El tercer factor es la temperatura del agua, 
caliente o tibia. El experimento se replicó 3 veces. La 
respuesta es el porcentaje de suciedad eliminada. Los 
datos son los siguientes: 


Marca Tipo Temperatura 

X En polvo Caliente 85 88 80 
Tibia 82 83 85 

Líquido Caliente 78 75 72 

Tibia 75 75 73 

Y En polvo Caliente 90 92 92 
Tibia 88 86 88 

Líquido Caliente 78 76 70 

Tibia 76 71 76 

7 En polvo Caliente 85 87 88 
Tibia 76 74 78 

Líquido Caliente 60 70 68 

Tibia 55 57 54 


a) ¿Existen efectos de la interacción significativos a 
un nivel œ = 0.05? 

b) ¿Hay diferencias significativas entre las tres mar- 
cas de detergente? 

c) ¿Cuál combinación de factores preferiría utilizar? 


14.24 Un científico recaba datos experimentales so- 
bre el radio de un grano de combustible propulsor, y, 
en función de la temperatura del polvo, la tasa de extru- 
sión y la temperatura del molde. Los resultados de los 3 
factores del experimento son los siguientes: 


Temp. del polvo 
150 190 
Temp. del molde Temp. del molde 
Tasa 220 250 220 250 
12 82 124 88 129 
24 114 157 121 164 


No se dispone de recursos para hacer experimentos re- 
petidos con las 8 combinaciones de factores. Se cree 
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que la tasa de extrusión no interactúa con la tempera- 
tura del molde, y que la interacción entre los 3 factores 
es despreciable. Así, esas 2 interacciones pueden agru- 
parse para producir un término de “error” con 2 grados 
de libertad. 

a) Haga un análisis de varianza que incluya los 3 
efectos principales e interacciones de 2 factores. 
Determine cuáles efectos influyen en el radio del 
grano de combustible. 

b) Construya gráficas de interacción para la tempera- 
tura del polvo usando la temperatura del molde y 
la del polvo mediante las interacciones de la tasa 
de extrusión. 

c) Comente acerca de la consistencia de la apariencia 
de las gráficas de interacción y las pruebas sobre 
las 2 interacciones en el ANOVA. 


14.25 En el libro Design of Experiments for Quality 
Improvement, publicado por la Japanese Standards 
Association (1989), se reporta un estudio sobre la ex- 
tracción de polietileno por medio de un solvente, y la 
manera en que la cantidad de gel (proporción) se ve in- 
fluida por 3 factores: el tipo de solvente, la temperatura 
de extracción y el tiempo de extracción. Se diseñó un 
experimento factorial y se obtuvieron los datos siguien- 
tes, expresados en proporción de gel. 


Tiempo 
Temp. del solvente 4 8 16 
Etanol 120 940 94.0 |93.8 94.2|91.1 90.5 
80 95.3 95.1 |94.9 95.3|92.5 92.4 
Tolueno 120 94.6 94.5 |93.6 94.1191.1 91.0 
80 95.4 95.4/95.6 96.0 |92.1 92.1 


а) Haga un análisis de varianza y determine cuáles 
factores e interacciones influyen en la proporción 
de gel. 

b) Construya una gráfica de la interacción entre cua- 
lesquiera 2 factores que sea significativa. Además, 
explique qué conclusión se podría extraer de la 
presencia de la interacción. 

c) Haga una gráfica de probabilidad normal de los 
residuales y comente. 


14.5 Experimentos factoriales para efectos aleatorios 


y modelos mixtos 


En un experimento de 2 factores con efectos aleatorios se tiene el modelo 


Yin = р +4; + В; + (AB) ij + Eijk, 


para i = 1, 2,..., a; j = 1, 2,..., b; y k = 1, 2,..., n, donde A, В, (AB), Y Es son variables 


aleatorias independientes con medias igual a 0 y varianzas т^, 0%, с? 


» Tag У 07, respecti- 


vamente. Las sumas de cuadrados para experimentos de efectos aleatorios se calculan 
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exactamente de la misma forma que en los experimentos de efectos fijos. Ahora se tiene 
interés en probar hipótesis con la forma 
ГА 2 ГА 

Ну: o = 0, 


Ho: ©з = 0, 
Н: о2 +0, Hi: ©з +0, 


Ho: Tag = 0, 


mm 


H;: Tag +0, 


donde el denominador en la razón fno es necesariamente el cuadrado medio del error. El 
denominador apropiado se determina examinando los valores esperados de los distintos 
cuadrados medios, los cuales se presentan en la tabla 14.14. 


Tabla 14.14: Cuadrados medios esperados para un experimento de efectos aleatorios de 2 factores 


Fuente de Grados de Cuadrado Cuadrado medio 
variación libertad medio esperado 

A a=1 52 а? + поз + bno? 
B b=1 55 а? +n073 + ano} 
AB (а — 1)(ЬЪ— 1) 52 а? + погв 

Error abín = 1) s? с? 

Total abn — 1 


En la tabla 14.14 se observa que H¿ y H e se prueban usando sí en el denominador 
de la razón f, mientras que H se prueba con s? en el denominador. Los estimados no 


sesgados de los componentes de la varianza son 


a2 
а= 


А Сав = 


б 


ап 


Tabla 14.15: Cuadrados medios esperados рага un experimento de efectos aleatorios de 3 factores 


Fuente de Grados de Cuadrado Cuadrado medio 

variación libertad medio esperado 
A a=1 s? о? + пов» + спод + пса + beno? 
B b=1 55 а? + поз» + сп Ts + an 98у + аспс 5 
С с—1 53 а? + пов у + тоа + ап Ohy + abno% 
AB (a—1)(b— 1) 84 а? + NT og y + NT ов 
AC (а — 1)(с— 1) 52 а? + NO gy + bnG 
BC (Ь— D(c—1) s? а? + позу + апођу 
АВС (а — 1)(Ъ— 1)(с = 1) 52 а? + пову 
Error ађс(п — 1) 52 о? 
Total abcn — 1 


En la tabla 14.15 se presentan los cuadrados medios esperados para el experimento 
de 3 factores con efectos aleatorios en un diseño completamente aleatorizado. А partir de 
los cuadrados medios esperados de la tabla 14.15 es evidente que se pueden formar 
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razones f adecuadas para probar todos los componentes de la varianza de la interacción 
de 2 y 3 factores. Sin embargo, para probar una hipótesis de la forma 


Ho: a = 0, 


Hi: о2 + 0, 


parece que no hay razón f apropiada, a menos que se encontrara que uno o más de los 
componentes de la varianza de interacción de 2 factores no es significativo. Por ejemplo, 
suponga que se hubiera comparado s4 (cuadrado medio AC) con s} (cuadrado medio 
ABC) y se encontrara que Ta es despreciable. Entonces podría argumentarse que el 
término O? debería eliminarse de todos los cuadrados medios esperados de la tabla 
14.15; entonces, la razón 52/52 ofrece una prueba de la significancia del componente т? 
de la varianza. Por lo tanto, si se prueba la hipótesis concerniente a los componentes de 
la varianza de los efectos principales, es necesario investigar primero la significancia 
de los componentes de la interacción de 2 factores. Cuando se encuentra que ciertos 
componentes de la varianza de la interacción de 2 factores son significativos, por lo 
que deben permanecer como parte del cuadrado medio esperado, se utiliza una prueba 
aproximada derivada por Satterthwaite (1946; véase la bibliografía) . 


Ejemplo 14.6: | En un estudio realizado para determinar cuáles son las fuentes importantes de la varia- 


ción en un proceso industrial, se toman 3 mediciones del producto para 3 operadores 
elegidos al azar, y se eligen en forma aleatoria 4 lotes de materia prima. Se decidió que 
debe hacerse una prueba estadística a un nivel de significancia de 0.05 para determinar 
si los componentes de la varianza debidos a los lotes, los operadores y la interacción son 
significativos. Además, tienen que calcularse los estimados de los componentes de la 
varianza. En la tabla 14.16 se presentan los datos con la respuesta expresada en porcen- 
taje por peso: 
Tabla 14.16: Datos para el ejemplo 14.6 


Lote 
Operador 1 2 3 4 
1 66.9 68.3 690 69.3 


68.1 674 69.8 70.9 
67.2 67.7 67.5 71.4 
2 66.3 68.1 697 69.4 
654 669 68.8 69.6 
65.8 676 692 70.0 
3 65.6 660 67.1 67.9 
66.3 669 662 68.4 
65.2 67.3 674 68.7 


Solución: Las sumas de cuadrados se calculan de la forma acostumbrada y se obtienen los siguien- 


tes resultados: 
STC (total) = 84.5564, SCE (error) = 10.6733, 
SCA (operadores) = 18.2106, SCB (lotes) = 50.1564, 
SC(AB) (interacción) = 5.5161. 

Se realizaron todos los demás cálculos y se presentan en la tabla 14.17. Como 


f0.05(2,6) = 5.14, — fo.0s(3,6) = 4.76, y  fo.os(6,24) = 2.51, 
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se descubre que los componentes de la varianza de los operadores y el lote son signifi- 
cativos. Aunque la varianza de la interacción no es significativa a un nivel œ = 0.05, el 
valor P es de 0.095. Los estimados de los componentes de la varianza del efecto princi- 


pal son 
9.1053 — 0.9194 16.7188 — 0.9194 
52 _ _ 22 _ _ 
65 = === 0.68, бз = 9 = 1.76. 
Tabla 14.17: Análisis de varianza para el ejemplo 14.6 
Fuente de Suma de Grados de Cuadrado f 
variación cuadrados libertad medio calculada 
Operadores 18.2106 2 9.1053 9.90 
Lotes 50.1564 3 16.7188 18.18 
Interacción 5.5161 6 0.9194 2.07 
Error 10.6733 24 0.4447 
Total 84.5564 35 


Experimento del modelo mixto 


Hay situaciones en que el experimento dicta la suposición de un modelo mixto, es decir, 
una mezcla de efectos aleatorios y fijos. Por ejemplo, para el caso de 2 factores se tiene 
que 


Yi =p +Aj +В; + (АВ )у + єй, 


рага і = 1, 2,...,а;ј = 1, 2,..., Б; К = 1, 2,..., п. Las А, pueden ser variables aleatorias 
independientes de Ew Y las В, pueden ser efectos fijos. La naturaleza mixta del modelo 
requiere que los términos de la interacción sean variables aleatorias. Como resultado, las 
hipótesis relevantes adoptan la forma 


mm 


Ну: 02=0 Ho: Bı =B; =: = В = 0, Ну: сар = 0, 


Н\: 0240, Н: Al menos una de las B; no es iguala 0, Н 1: Dag +0. 


Otra vez, los cálculos de la suma de cuadrados son idénticos a los de las situaciones de 
efectos fijos y aleatorios, y la prueba F es determinada por los cuadrados medios espe- 
rados. La tabla 14.18 proporciona los cuadrados medios esperados para el problema del 
modelo mixto de 2 factores. 


Tabla 14.18: Cuadrados medios esperados para el experimento del modelo mixto de 2 factores 


Factor Cuadrado medio esperado 
A (aleatorios) o° + bno? 
B (fijos) а? +n0 +55 УВ? 

J 


AB (aleatorios) o° + nO a 
Error о? 
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A partir de la naturaleza de los cuadrados medios esperados queda claro que la 
prueba sobre el efecto aleatorio emplea el cuadrado medio del error s? como deno- 
minador, mientras que la prueba sobre el efecto fijo utiliza el cuadrado medio de inte- 
racción. Suponga que ahora se consideran 3 factores. En este caso, por supuesto, debe 
tomarse en cuenta la situación en que un factor es fijo y la situación en que 2 factores son 
fijos. La tabla 14.19 cubre ambas situaciones. 


Tabla 14.19: Cuadrados medios esperados para experimentos factoriales de modelo mixto de 3 factores 


A aleatoria 


A aleatoria, B aleatoria 


0? + beno? 


с + спо + beno? 


b 2 
Be 
о? + споса + асп > 5 с? + + acno > 
J = 
< c? 05 
С а? + пс + abn 2 T о? + nO gy + anog, + поду + abn 2 = 
2 2 E 2 2 Е 
АВ EE + 0 од = + Спо ав Р 
АС с +bn0 q, e 9 + NO ¿gy + по 
2 2 jk 2 2 2 
BC 9 +N0 ¿gy + ап 2 >; тасу © + NO gy + 408, 
2 2 2 2 
АВ o- + пову 0% + MO ay 
Error с o? 
Observe que en el caso de A aleatoria todos los efectos tienen pruebas f apropiadas. 
No obstante, para A y B aleatorias, el efecto principal C debe probarse utilizando un 
procedimiento tipo Satterthwaite, similar al que se emplea en el experimento de efectos 
aleatorios. 
Ejercicios 


14.26 Suponga un experimento de efectos aleatorios 
para el ejercicio 14.2 de la página 575 y estime los 
componentes de la varianza para las marcas de con- 
centrado de jugo de naranja, para el número de días 
transcurridos a partir del día en que se mezcló el jugo 
hasta el día en que se hizo la prueba, y para el error 
experimental. 


14.27 Para estimar los diversos componentes de la 
variabilidad en un proceso de filtración el porcentaje 
de material que se pierde en el licor madre se mide en 
12 condiciones experimentales, con 3 corridas en cada 
condición. Se seleccionan al azar 3 filtros y 4 operado- 
res para usarlos en el experimento. 

a) Pruebe la hipótesis de que no hay un componente 
de interacción de la varianza entre los filtros y los 
operadores a un nivel de significancia œ = 0.05. 

b) Pruebe la hipótesis de que los operadores y los fil- 
tros no tienen ningún efecto sobre la variabilidad 
del proceso de filtración a un nivel de significancia 
а = 0.05. 


с) Estime los componentes de la varianza que se de- 
ben a los filtros, a los operadores y al error experi- 


mental. 
Operador 
Filtro 1 2 3 4 
1 16.2 15.9 15.6 14.9 
16.8 15.1 15.9 15.2 
171 145 16.1 149 
2 16.6 16.0 16.1 15.4 
16.9 163 16.0 14.6 
16.8 165 172 15.9 
3 167 165 164 16.1 
16.9 169 174 154 
17.1 16.8 16.9 15.6 


14.28 Un contratista de la defensa está interesado en 
estudiar un proceso de inspección para detectar la falla 
O la fatiga de partes de recambio. Se utilizan 3 niveles 
de inspección que ejecutan 3 inspectores elegidos al 
azar. Se emplean 5 lotes para cada combinación en el 
estudio. Los niveles de los factores están en los datos. 


Ejercicios 


La respuesta se expresa en fallas por cada 1000 piezas. 
a) Escriba un modelo adecuado, con suposiciones. 
b) Utilice análisis de varianza para probar las hipó- 

tesis apropiadas para los inspectores, el nivel de 
inspección y la interacción. 


Nivel de inspección 


Inspección Inspección 
militar militar 
Inspector completa | reducida | Comercial 
A 7.50 7.42 | 7.08 6.17 | 6.15 5.52 
5.85 5.89 | 5.65 5.30 | 5.48 5.48 
5.35 5.02 5.98 
B 7.58 6.52 | 7.68 5.86 | 6.17 6.20 
6.54 5.64 | 5.28 5.38 | 5.44 5.75 
5.12 4.87 5.68 
C 7.70 6.82 | 7.19 6.19 | 6.21 5.66 
6.42 5.39 | 5.85 5.35 | 5.36 5.90 
5.35 5.01 6.12 


14.29 Considere el análisis de varianza siguiente para 
un experimento de efectos aleatorios: 


Fuente de Grados de Cuadrado 

variación libertad medio 
A 3 140 
B 1 480 
С 2 325 
АВ 3 15 
АС 6 24 
ВС 2 18 
АВС 6 2 
Error 24 5 
Total 47 


Pruebe si existen componentes significativos de la va- 
rianza entre todos los efectos principales y los efectos 
de interacción a un nivel de significancia de 0.01, 
a) utilice un estimado agrupado del error cuando esto 
sea apropiado; 
b) sin agrupar las sumas de los cuadrados de efectos 
insignificantes. 


14.30 А un gerente de una planta le gustaría demos- 
trar que la producción de una fábrica de lana de su 
planta no depende del operador de la máquina ni de 
la hora del día, y que es consistentemente elevada. Se 
eligen al azar 4 operadores y 3 horas del día para el 
estudio. Se mide el producto en yardas por minuto y se 
toman muestras 3 días elegidos al azar. 

a) Escriba el modelo apropiado. 

b) Evalúe los componentes de la varianza para el 

operador y la hora. 
с) Saque sus conclusiones. 
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Operador 

Hora 1 2 3 4 
1 9.5 9.8 9.8 10.0 
98 10.1 103 97 

100 96 97 10.2 

2 10.2 10.1 10.2 10.3 
9.9 9.8 9.8 10.1 

9.5 97 97 9.9 

3 105 104 99 10.0 
10.2 10.2 10.3 10.1 

9.3 98 102 97 


14.31 Un fabricante de pintura de látex para interio- 
res (marca A) quisiera demostrar que su pintura es más 
robusta para el material donde se aplica, que la de sus 2 
competidores más cercanos. La respuesta es el tiempo, 
en años, hasta que comienza a picarse. El estudio in- 
cluye las 3 marcas de pintura y 3 materiales selecciona- 
dos al azar. Para cada combinación se utilizan 2 piezas. 


Marca de pintura 


Material A B C 
A 5.50 5.15 | 4.75 4.60 | 5.10 5.20 
B 5.60 5.55 | 5.50 5.60 | 5.40 5.50 
C 5.40 5.48 | 5.05 4.95 | 4.50 4.55 


a) ¿Cómo se le llama a este tipo de modelo? 

b) Analice los datos usando el modelo apropiado. 

c) ¿Los datos apoyan la afirmación del fabricante de 
la marca A? 


14.32 Un ingeniero de procesos desea determinar si 
el ajuste de potencia de las máquinas que se usan para 
llenar ciertos tipos de cajas de cereal tienen un efecto 
significativo sobre el peso real del producto. El estudio 
consta de 3 tipos de cereal elaborados por la empresa, 
elegidos al azar, y 3 flujos fijos de energía. Para cada 
combinación se mide el peso de 4 cajas de cereal dife- 
rentes seleccionadas al azar. El peso deseado es de 400 
gramos. A continuación se presentan los datos. 


Ajuste de Tipo del cereal 
potencia 1 2 3 
Bajo 395 390 | 392 392 | 402 405 
401 400 | 394 401 | 399 399 
Actual 396 399 | 390 392 | 404 403 
400 402 | 395 502 | 400 399 
Alto 410 408 | 404 406 | 415 412 
408 407 | 401 400 | 413 415 


a) Proporcione el modelo adecuado y liste las suposi- 
ciones que se hacen. 

b) ¿Hay un efecto significativo debido al ajuste de 
potencia? 

c) ¿Existe un componente de la varianza significativo 
debido al tipo de cereal? 
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14.33 El Centro de Consulta Estadística de Virginia 
Tech participó en el análisis de un conjunto de datos 
tomados por el personal del Departamento de Nutrición 
Humana y Alimentos, al cual le interesaba estudiar los 
efectos del tipo de harina y el porcentaje de edulcorante 
sobre ciertos atributos físicos de un tipo de pastel. Se 
usó harina multiusos y para pasteles, y el porcentaje 
de edulcorante varió en 4 niveles. Los siguientes datos 
presentan información acerca de la gravedad específica 
de las muestras de pastel. Se prepararon 3 pasteles con 
cada una de las 8 combinaciones de factores. 


Concentración Harina 
de edulcorante Multiusos Para pasteles 
0 0.90 0.87 0.90 | 0.91 0.90 0.80 
50 0.86 0.89 0.91 | 0.88 0.82 0.83 
75 0.93 0.88 0.87 | 0.86 0.85 0.80 
100 0.79 0.82 0.80 | 0.86 0.85 0.85 


a) Realice un análisis de varianza con 2 factores. 
Pruebe si existen diferencias entre los tipos de ha- 
rina. Pruebe si hay diferencias entre las concentra- 
ciones de edulcorante. 

b) Analice el efecto de la interacción, si lo hubiera. 
Proporcione valores P para todas las pruebas. 


14.34 Se llevó а cabo un experimento еп el 
Departamento de Ciencias de Alimentos de Virginia 
Tech. El objetivo fue caracterizar la textura de cierto 
tipo de pescado de la familia de los arenques. También 
se estudió el efecto de los tipos de salsa empleada para 
preparar el pescado. La respuesta en el experimento era 
un “valor de textura”, medido con una máquina que re- 
banaba el producto de los peces. Los siguientes datos 
son los valores de textura: 


Tipo de pescado 
Sábalo sin Sábalo 
Tipo de salsa curar curado Arenque 
Crema ácida 27.6 57.4 | 64.0 66.9 |1070 83.9 
47.8 71.1 | 66.5 66.8 |1104 93.4 
53.8 53.8 83.1 
Salsa envinada 49.8 31.0 | 48.3 62.2 | 88.0 952 
118 35.1 | 54.6 43.6 |108.2 86.7 
16.1 41.8 105.2 


a) Haga un análisis de varianza. Determine si hay o 
no interacción entre el tipo de salsa y el tipo de 
pescado. 

b) Con base en los resultados del inciso a y en prue- 
bas F de los efectos principales, determine si hay 
una diferencia significativa en la textura debido a 
los tipos de salsa, y determine si existe una dife- 
rencia significativa entre los tipos de pescado. 


14.35 Se hizo un estudio para determinar si las con- 
diciones de humedad afectan la fuerza que se requiere 
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para separar piezas de plástico engomadas. Se proba- 
ron 3 tipos de plástico con 4 niveles de humedad. Los 
resultados, en kilogramos, son los siguientes: 


Humedad 

Tipo de plástico 30% 50% 70% 90% 
A 39.0 33.1 338 33.0 

428 378 307 32.9 

В 36.9 272 297 28.5 

41.0 268 291 27.9 

С 274 292 267 30.9 

30.3 299 320 31.5 


a) Suponga un experimento de efectos fijos, realice 
un análisis de varianza y pruebe la hipótesis de que 
no hay interacción entre la humedad y el tipo de 
plástico a un nivel de significancia de 0.05. 

b) Utilice sólo los plásticos A y B y el valor de s? del 
inciso a y vuelva a probar la presencia de interac- 
ción a un nivel de significancia de 0.05. 


14.36 Personal del Departamento de Ingeniería de 
Materiales de Virginia Tech llevó a cabo un expe- 
rimento para estudiar los efectos de los factores am- 
bientales sobre la estabilidad de cierto tipo de aleación 
cobre-níquel. La respuesta básica fue la vida de fatiga 
del material. Los factores son el nivel de esfuerzo y el 
ambiente. Los datos son los siguientes: 


Nivel de esfuerzo 


Ambiente Bajo Medio Alto 
Hidrógeno 11.08 13.12 14.18 
ѕесо 10.98 13.04 14.90 
11.24 13.37 15.10 
Humedad 10.75 12.73 14.15 
elevada 10.52 12.87 14.42 
(95%) 10.43 12.95 14.25 


а) Haga un análisis de varianza para probar la inte- 
racción entre los factores. Use œ = 0.05. 

b) Con base en el inciso a) efectúe un análisis sobre 
los 2 efectos principales y saque sus conclusiones. 
Utilice el método del valor P para sus conclusiones. 


14.37 En el experimento del ejercicio de repaso 
14.33 también se utilizó el volumen del pastel como 
respuesta. Las unidades en que se expresa son pulgadas 
cúbicas. Pruebe la interacción entre los factores y ana- 
lice los efectos principales. Suponga que los 2 factores 
son efectos fijos 


Concentración de Harina 
edulcorante Multiusos Para pasteles 
0 4.48 3.98 4.42 | 4.12 4.92 5.10 
50 3.68 5.04 3.72 | 5.00 4.26 4.34 
75 3.92 3.82 4.06 | 4.82 4.34 4.40 
100 3.26 3.80 3.40 | 4.32 4.18 4.30 


Ejercicios de repaso 


14.38 Una válvula de control necesita ser muy sen- 
sible al voltaje de entrada para así generar un voltaje 
de salida adecuado. Un ingeniero gira las perillas de 
control para cambiar el voltaje de entrada. En el libro 
SN-Ratio for the Quality Evaluation, publicado por la 
Japanese Standards Association (1988), se describe un 
estudio sobre la forma en que esos 3 factores (posición 
relativa de las perillas de control, rango de control de 
las perillas y voltaje de entrada) influyen en la sensibi- 
lidad de una válvula de control. A continuación se pre- 
sentan los factores y sus niveles. Los datos se refieren a 
la sensibilidad de una válvula de control. 

Factor A: posición relativa de las perillas de control: 

centro —0.5, centro y centro + 0.5 
Factor B: rango de control de las perillas: 


2, 4.5 y 7 (mm) 

Factor C: voltaje de entrada: 100, 120 y 150 (V) 

C 

А B Cı Ca C3 
А, B, 151 135 | 151 135 | 151 138 
A B, 178 171 | 180 173 | 181 174 
A Вз 204 190 | 205 190 | 206 192 
A: B, 156 148 | 158 149 | 158 150 
Аз Bı 183 168 | 183 170 | 183 172 
Аз Вз 210 204 | 211 203 | 213 204 
Аз B, 161 145 | 162 148 | 163 148 
Аз B2 189 182 | 191 184 | 192 183 
Аз Вз 215 202 | 216 203 | 217 205 


Realice un análisis de varianza con о = 0.05 para pro- 
bar la existencia de efectos principales y de interacción 
significativos. Saque sus conclusiones. 


14.39 En el ejercicio 14.25 de la página 588 se des- 
cribe un experimento que implica la extracción de po- 
lietileno a través de un solvente. 


Tiempo 
Solvente 4 8 16 
Etanol 120 940 94.0| 93.8 942 | 91.1 90.5 
80 95.3 95.1| 94.9 95.3 | 92.5 92.4 
Tolueno 120 94.6 94.5| 93.6 94.1 | 91.1 91.0 
80 95.4 95.4| 95.6 96.0 | 92.1 92.1 


a) Haga una clase diferente de análisis de los datos. 
Ajuste un modelo adecuado de regresión con una 
variable categórica del solvente, un término de 
temperatura, un término de tiempo, una interac- 
ción de la temperatura y el tiempo, una interacción 
del solvente y la temperatura y una interacción del 
solvente y el tiempo. Realice pruebas г para todos 
los coeficientes y describa sus hallazgos. 

b) ¿Sus resultados sugieren que el etanol y el tolueno 
requieren modelos diferentes, o son equivalentes 
aparte de las intersecciones? Explique su respuesta. 

c) ¿Encontró alguna conclusión que contradiga las 
conclusiones que sacó de la solución del ejercicio 
14.25? Explique su respuesta. 
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14.40 Enel libro SN-Ratio for the Quality Evaluation, 
publicado por la Japanese Standards Association 
(1988), se describe un estudio acerca de cómo la pre- 
sión del aire de los neumáticos afecta la maniobrabi- 
lidad de un automóvil. Se compararon 3 presiones 
distintas de aire en los neumáticos sobre 3 superficies 
diferentes de manejo. Las 3 presiones del aire fueron: 
los neumáticos tanto del lado izquierdo como del de- 
recho inflados a 6 kgf/cm?, los neumáticos del lado 
izquierdo inflados a 6 kgf/cm? y los del lado derecho 
inflados a 3 kgf/cm?, y los neumáticos de ambos la- 
dos inflados a 3 kgf/cm?. Las tres superficies de manejo 
fueron asfalto, asfalto seco y cemento seco. Se observó 
2 veces el radio de giro de un vehículo de prueba para 
cada nivel de presión de los neumáticos sobre cada una 
de las 3 superficies de manejo. 


Presión del aire de los neumáticos 


Superficie 

de manejo 1 2 3 
Asfalto 44.0 25.5 | 34.2 37.2 |27.4 42.8 
Asfalto seco 31.9 33.7 | 31.8 27.6 |43.7 38.2 
Cemento seco 27.3 39.5 | 46.6 28.1 [35.5 34.6 


Realice un análisis de varianza con los datos anterio- 
res. Haga comentarios acerca de la interpretación de los 
efectos principales y de interacción. 


14.41 El fabricante de cierta marca de café secado por 
congelación espera reducir el tiempo del proceso sin 
arriesgar la integridad del producto. El ingeniero de 
procesos desea usar 3 temperaturas para la cámara 
de secado y 4 tiempos de secado. El tiempo de secado 
actual es de 3 horas a una temperatura de —15°C. La 
respuesta del sabor es un promedio de las calificaciones 
de 4 jueces profesionales. La calificación está en una 
escala de 1 a 10, donde 10 es la mejor. En la tabla que 
sigue se presentan los datos. 


Temperatura 
Tiempo  —20*C — 15°С —10°С 
1hr 9.60 9.63 | 9.55 9.50 | 9.40 9.43 
1.5 hr 9.75 9.73 | 9.60 9.61 | 9.55 9.48 
2 hr 982 9.93 | 9.81 9.78 | 9.50 9.52 
3 hr 978 9.81 | 9.80 9.75 | 9.55 9.58 


a) ¿Qué tipo de modelo se debe utilizar? Plantee las 
suposiciones. 

b) Analice los datos en forma apropiada. 

с) Redacte un breve informe рага el vicepresidente 
encargado y hágale una recomendación para la 
elaboración futura de este producto. 


14.42 Para garantizar el número de cajeros necesa- 
rios durante las horas pico de operación, un banco ur- 
bano recabó datos. Se estudiaron 4 cajeros durante 3 
horarios “ocupados”, 1) entre semana, de 10:00 a 11:00 
A.M., 2) por las tardes entre semana, entre las 2:00 y 
las 3:00 P.M., y 3) las mañanas de los sábados, entre 
11:00 y las 12:00. Un analista eligió al azar 4 horarios 
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dentro de cada uno de los 3 periodos, para cada una de lisis de varianza estándar con los datos anteriores. 
las 4 posiciones de los cajeros durante varios meses y ¿Qué suposiciones, si las hubiera, se violarían? 
se observó el número de clientes atendidos. Los datos b) Elabore una tabla de ANOVA estándar que in- 


son los siguientes: 


cluya pruebas F de los efectos principales y las 
Periodo interacciones. Si las interacciones y los efectos 


Р) 3 principales resultan significativos, establezca las 


Cajero g conclusiones científicas. ¿Qué aprendimos? Ase- 
> Р a o r a - = | a | | | gúrese de interpretar cualquier interacción sig- 
3 12 19 11 22 |27 33 27 24 125 20 29 15 nificativa. Utilice su propio juicio respecto a los 
4 11 913 8|10 719 8|11 9 17 9 valores P n 

c) Vuelva a hacer el análisis completo usando una 

Se supone que el número de clientes atendidos es una transformación apropiada de la respuesta. ¿En- 

variable aleatoria de Poisson. contró alguna diferencia en los resultados? Haga 

a) Comente sobre el riesgo de llevar a cabo un aná- comentarios al respecto. 


14.6 Posibles riesgos y errores conceptuales; relación con el material 


de otros capítulos 


Uno de los temas más susceptibles de confusión en el análisis de experimentos factoria- 
les radica en la interpretación de los efectos principales ante la presencia de interacción. 
La existencia de un valor P relativamente grande para un efecto principal, cuando es 
clara la presencia de interacciones, podría tentar al analista a concluir que “no existe 
efecto principal significativo”. Sin embargo, debe entenderse que si un efecto principal 
está implicado en una interacción significativa, entonces el efecto principal está influ- 
yendo en la respuesta. La naturaleza del efecto es inconsistente a través de los niveles 
de otros efectos. La naturaleza del papel que desempeña el efecto principal se deduce de 
las gráficas de interacción. 

Debido a lo que se expresa en el párrafo anterior, hay un gran peligro de usar la es- 
tadística de manera equivocada cuando se emplea una prueba de comparación múltiple 
sobre los efectos principales ante la presencia clara de interacción entre los factores. 

Debe tenerse precaución en el análisis de un experimento factorial cuando se supone 
un diseño completamente aleatorizado y en realidad no se hizo tal aleatorización. Por 
ejemplo, es común que se encuentren factores que son muy difíciles de cambiar. Como 
resultado, podría ser necesario mantener sin cambio los niveles de factores durante lar- 
gos periodos a lo largo de todo el experimento. El ejemplo más común es el factor 
temperatura. Subirla o bajarla en un esquema aleatorio es un plan costoso y la mayoría 
de los experimentadores evitarán hacerlo. Los diseños experimentales con restricciones 
en la aleatorización son muy comunes y reciben el nombre de diseños de gráficas se- 
paradas. Esos diseños rebasan el alcance de este libro, pero en Montgomery (2008a) se 
encuentra su presentación. 

Muchos de los conceptos que se analizaron en este capítulo se utilizarán en el ca- 
pítulo 15, por ejemplo, la importancia de la aleatorización y el papel que desempeña 
la interacción en la interpretación de los resultados. Sin embargo, en el capítulo 15 
se cubren 2 áreas que representan una expansión de los principios que se estudiaron en 
este capítulo y en el capítulo 13. En el capítulo 15 la solución de problemas con el uso 
de experimentos factoriales se realiza por medio del análisis de regresión, ya que se 
supone que la mayoría de los factores son cuantitativos y que se miden en un continuo, 
como la temperatura y el tiempo. Se derivan ecuaciones de predicción a partir de los 
datos del experimento diseñado y se utilizan para la mejora de procesos o incluso para su 
optimización. Además, se estudia el tema de los factoriales fraccionarios, en los que sólo 
una parte o fracción de todo el experimento factorial se aplica debido al costo excesivo 
que implica la realización de todo el experimento. 


Capítulo 15 


Experimentos factoriales 2* 
y fracciones 


15.1 Introducción 


Ya se han expuesto ciertos conceptos del diseño experimental. El plan de muestreo para 
la prueba £ simple sobre la media de una población normal y el análisis de varianza 
implican la asignación aleatoria de los tratamientos preseleccionados a las unidades ex- 
perimentales. El diseño de bloques aleatorizados, en el que los tratamientos se asignan 
a las unidades dentro de bloques relativamente homogéneos implica una aleatorización 
restringida. 

En este capítulo se presta atención especial a los diseños experimentales en los 
que el plan experimental requiere estudiar el efecto sobre una respuesta de k factores, 
cada uno en dos niveles. А éstos se les conoce como experimentos factoriales 2%. Es 
frecuente que los niveles se denoten por “alto” y “bajo”, aunque esa notación podría ser 
arbitraria en el caso de variables cualitativas. El diseño factorial completo requiere que 
cada nivel de cada factor ocurra con cada nivel de cada uno de los demás factores, lo 
que da un total de 2* combinaciones de tratamientos. 


Filtrado de factores y experimentación secuencial 


A menudo, cuando se realizan experimentos, ya sea en una investigación o a un nivel 
de desarrollo, un diseño experimental bien planeado corresponde a una etapa de lo que 
en realidad es el plan secuencial de la experimentación. Lo más frecuente al comienzo 
de un estudio es que los científicos e ingenieros no estén conscientes de cuáles facto- 
res son importantes ni de cuáles son los rangos apropiados para los factores potencia- 
les sobre los que deben realizar la experimentación. Por ejemplo, en el libro Response 
Surface Methodology, Myers, Montgomery y Anderson-Cook (2009) dan un ejemplo 
de una investigación realizada en una planta piloto, la cual incluye un experimento en 
el que cuatro factores, temperatura, presión, concentración de formaldehído y tasa de 
agitación, se varían para establecer su influencia sobre la respuesta, es decir, la tasa 
de filtración de cierto producto químico. Incluso al nivel de planta piloto los científi- 
cos no están seguros respecto a si deben incluir los 4 factores en el modelo. Además, 
el objetivo final consiste en determinar la configuración adecuada de los factores con- 
tribuyentes que maximice la tasa de filtración. Por lo tanto, es necesario determinar 
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la región apropiada de experimentación. Estas preguntas sólo pueden responderse si 
todo el plan experimental se realiza en forma secuencial. Muchos procesos experimen- 
tales son planes que implican un aprendizaje iterativo, el tipo de aprendizaje consistente 
con el método científico, en el que la palabra iterativo implica experimentación por 
etapas. 

Por lo común la primera etapa del plan secuencial ideal es variable o de filtrado 
de factores, un procedimiento que implica un diseño experimental de bajo costo en el 
que se utilizan factores candidatos. Esto es especialmente importante cuando el plan 
requiere un sistema complejo, como un proceso de manufactura. La información obte- 
nida a partir de los resultados de un diseño de filtrado se emplea para diseñar uno o más 
experimentos posteriores, en los que se realizan ajustes de los factores importantes, los 
cuales proporcionan mejorías en el sistema o en el proceso. 

Los experimentos factoriales 2* y fracciones de 2* son poderosas herramientas que 
constituyen diseños de filtrado ideales; son sencillos y prácticos, y atraen por intuición. 
Muchos de los conceptos generales que se estudian en el capítulo 14 siguen siendo váli- 
dos. Sin embargo, hay métodos gráficos que brindan información útil para el análisis de 
los diseños de 2 niveles. 


Diseños de selección para cantidades grandes de factores 


Cuando k es pequeña, digamos k = 2 o incluso k = 3, es evidente la utilidad del factorial 
2* para el filtrado de factores. Tanto el análisis de varianza como el de regresión, que se 
estudiaron e ilustraron en los capítulos 12, 13 y 14, continúan siendo herramientas útiles. 
Además, los enfoques gráficos también pueden ser de ayuda. 

Si k es grande, por ejemplo 6, 7 u 8, el número de combinaciones de factores y, 
por lo tanto, de corridas experimentales necesarias para el factorial 2* con frecuencia 
se vuelve prohibitivo. Por ejemplo, suponga que hay interés en realizar un diseño de 


selección que involucre k = 8 factores. Podría desearse obtener información acerca 


de todos los k = 8 efectos principales, así como de las ше D = 28 interacciones de dos 


factores. Sin embargo, incluso 28 = 256 corridas parecería que hace al estudio dema- 
siado grande y excesivo para estudiar 28 + 8 = 36 efectos. No obstante, como se verá en 
secciones posteriores, cuando k es grande es posible obtener gran cantidad de informa- 
ción de manera eficaz usando sólo una fracción del experimento factorial 2* completo. 
Esta clase de diseños constituye la clase de diseños factoriales fraccionarios. La meta 
consiste en recuperar información de alta calidad acerca de los efectos principales y las 
interacciones interesantes, aun cuando el tamaño del diseño se reduzca en forma consi- 
derable. 


15.2 El factorial 2*: cálculo de efectos y análisis 


de varianza 


Considere inicialmente un factorial 2? con factores A y B, y n observaciones experi- 
mentales por combinación de factores. Es útil emplear los símbolos (1), a, b y ab para 
denotar los puntos del diseño, donde la presencia de una letra minúscula implica que el 
factor (A o B) está en el nivel alto. Así, la ausencia de la minúscula implica que el factor 
está en el nivel bajo. Por lo que ab es el punto de diseño (+, +), а es (+, —), bes (—, +) 
y (1) es (—, —). Asimismo existen situaciones en las que la notación también se aplica 
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para los datos de respuesta en el punto de diseño en cuestión. Como introducción al 
cálculo de efectos importantes que ayuden a determinar la influencia de los factores y 
sumas de cuadrados que están incorporados en los cálculos del análisis de varianza se 
presenta la tabla 15.1. 


Tabla 15.1: Un experimento factorial 2? 


A Media 
В | Ь аЬ — 
Ф а 
Media Эш алар. 


En esta tabla, (1), a, b у ab representan totales de los п valores de la respuesta en los 
puntos de diseño individuales. La simplicidad del factorial 2? reside en el hecho de que, 
aparte del error experimental, el analista obtiene la información importante en compo- 
nentes con un solo grado de libertad, uno para cada uno de los dos efectos principales 
A y B, y un grado de libertad para la interacción AB. La información que se recupera 
sobre todos estos aspectos adopta la forma de tres contrastes. Se definirán los siguientes 
contrastes entre los totales de los tratamientos: 


contraste A = ab + a — b — (1), 
contraste B = ab — a + b — (1), 
contraste AB = ab — a — b + (1). 


Los tres efectos del experimento implican estos contrastes y apelan al sentido común y 
a la intuición. Los dos efectos principales calculados tienen la forma 


efecto = ўн — JL, 


donde ўн y Yz son las respuestas promedio en el nivel alto o “+” y en el nivel bajo o “—”, 
respectivamente. Como resultado, 


Cálculo de los з= аһ+а—Ь—(1) _ contraste A 
| efectos 7 2n = 2n 
principales 
y 


_ab—a+b—(1) _ contraste В 
= 2п Е 2п ` 


La cantidad A es considerada la diferencia entre la respuesta media en los niveles 
alto y bajo del factor A. De hecho, A se denomina efecto principal del factor A. En 
forma similar, B es el efecto principal del factor B. Al inspeccionar la diferencia entre 
ab — b y a — (1) o entre ab — a y b — (1) en la tabla 15.1, se observa una aparente inte- 
racción en los datos. Si, por ejemplo, 


ab=a =b=(1) o bien ab—=a—b+(1)=0, 
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una recta que conecta las respuestas para cada nivel del factor A en el nivel alto del factor 
B será aproximadamente paralela a una recta que conecte la respuesta para cada nivel del 
factor A en el nivel bajo del factor B. Las rectas no paralelas de la figura 15.1 sugieren 
la presencia de interacción. Para probar que esta interacción aparente es significativa se 
construye un tercer contraste en los totales del tratamiento, ortogonal a los contrastes del 
efecto principal, al cual se denomina efecto de interacción. La construcción del tercer 
contraste mencionado se realiza evaluando 


Efecto de 
interacción 


_ab=a—b+(1) _ contraste AB 


AB 
2n 2n 
Nivel alto de B »ab 
с b+ „а 
g B 
2 .„ де 
9 е: pao Е 
@ S 


(1)* 


Вајо Nivel de A Alto 


Figura 15.1: Respuesta que sugiere una interacción aparente. 


Ejemplo 15.1: | Considere los datos de las tablas 15.2 y 15.3 соп n = 1 para un experimento factorial 22. 


Tabla 15.2: Factorial 2? sin interacción Tabla 15.3: Factorial 22 con interacción 
B B 
A — + A = + 
+ 50 70 + 50 70 
— 80 100 — 80 40 


Los números en las celdas de las tablas 15.2 y 15.3 ilustran con claridad la manera 
en que los contrastes y el cálculo resultante de los dos efectos principales y de las con- 
clusiones resultantes pueden estar muy influidos por la presencia de interacción. En la 
tabla 15.2 el efecto de A es —30 tanto en el nivel bajo como en el nivel alto del factor 
B, y el efecto de B es 20 en los niveles bajo y alto del factor A. Esta “consistencia del 
efecto” (no hay interacción) puede ser información muy importante para el analista. 
Los efectos principales son 


70+50 100+ 80 


A= > > = 60 — 90 = —30, 
p= AR DE L g5 — 65 = 20, 


mientras que el efecto de la interacción es 


AB = M DE 73—75=0. 
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Respuesta 
~ 
o 


Por otro lado, en la tabla 15.3 el efecto A es nuevamente —30 al nivel bajo de B, pero +30 
al nivel alto de В. Esta “inconsistencia del efecto” (interacción) también está presente 
para B en todos los niveles de A. En estos casos los efectos principales podrían carecer 
de significado y, de hecho, prestarse mucho a la confusión. Por ejemplo, el efecto de A es 


a 20470 _ 80440 _ 


0, 

2 2 
уа que hay ип “enmascaramiento” completo del efecto conforme se promedia sobre los 
niveles de B. La fuerte interacción se ilustra con el efecto calculado 


_70+80 50+40 _ 


AB 
2 2 


30. 


Aquí es conveniente ilustrar los escenarios de las tablas 15.2 y 15.3 con las gráficas de 
interacción. Observe el paralelismo en la gráfica de la figura 15.2 y la interacción apa- 
rente en la figura 15.3. J 


Respuesta 


=1 1 
A A 


Figura 15.2: Gráfica de interacción para los Figura 15.3: Gráfica de interacción para los 
datos de la tabla 15.2. datos de la tabla 15.3. 


Cálculo de las sumas de cuadrados 


Se aprovecha el hecho de que en el factorial 2?, o para el caso en el experimento factorial 
2! general, cada efecto principal y efecto de interacción tiene asociado un solo grado de 
libertad. Por lo tanto, es posible escribir contrastes ortogonales 2* — 1 con un solo grado 
de libertad en las combinaciones de tratamientos, donde cada uno es responsable de la 
variación debida a cierto efecto principal o interacción. Así, con base en las suposicio- 
nes usuales de independencia y normalidad en el modelo experimental, se hacen prue- 
bas para determinar si el contraste refleja variación sistemática, o bien, sólo variaciones 
probabilísticas o aleatorias. Las sumas de cuadrados para cada contraste se calculan 
siguiendo los procedimientos que se estudiaron en la sección 13.5. Si se escribe 


Y, =b+(1), Y, =ab + a, с = –1 y с, = 1, 


1 2, 1 
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donde Y, y Y, constituyen el total de 2n observaciones, se tiene 


Т 2 
iYi 

SCA =SCwa = $ í ) _[ab+a—b—(1)1? _ (contraste AY 

Е а Е 22n Е 22n , 


con 1 grado de libertad. De forma similar, se encuentra que 


[ab +b—a — (1)]2 _ (contraste В )? 
22n ©: 22n 


SCB = 


lab + (1) —a—bP? _ (contraste AB)? 


АВ) = 
SOLARE) 22n 22n 


Cada contraste tiene 1 grado de libertad, mientras que las sumas de cuadrados del error, 
con 22(п — 1) grados de libertad, se obtienen mediante una resta a partir de la fórmula 


SCE = SCT — SCA — SCB — SC(AB). 


Al calcular las sumas de cuadrados para los efectos principales A y B, y el efecto 
de interacción AB, es conveniente presentar las salidas totales de las combinaciones de 
tratamiento junto con los signos algebraicos apropiados para cada contraste, como se ob- 
serva en la tabla 15.4. Los efectos principales se obtienen como comparaciones simples 
entre los niveles alto y bajo. Por lo tanto, se asigna un signo positivo para la combinación 
de tratamientos que esté en el nivel alto de un factor dado, y uno negativo a la com- 
binación de tratamientos del nivel bajo. Los signos positivo y negativo para el efecto 
de interacción se obtienen multiplicando los signos correspondientes de los contrastes de 
los factores de la interacción. 


Tabla 15.4: Signos para los contrastes en un experimento factorial 2? 


Combinación Efecto factorial 
de tratamientos A B АВ 
(1) > = эр 

а T = = 

Ь - + - 

ab + + + 


El factorial 2° 


Ahora consideremos un experimento en el que intervienen tres factores, A, B y C, cada 
uno con niveles —1 y +1. Se trata de un experimento factorial 2° que proporciona ocho 
combinaciones de tratamientos (1), a, b, с, ab, ac, bc y abc. En la tabla 15.5 se presentan 
las combinaciones de tratamientos y los signos algebraicos apropiados para cada con- 
traste que se usan en el cálculo de las sumas de los cuadrados para los efectos principales 
y los efectos de interacción. 
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Tabla15.5:Signos de los contrastes en un experimento factorial 2* 


Efecto factorial (simbólico) 


Combinación 
de tratamiento A B С АВ AC ВС ABC 

(1) = — — + + + — 

a +- = =- + + 

= + = -= + - + 

с = - + + -=  - + 

ab Pop <= + = = = 

ac > же сэр = E = = 

bc = + + = = T = 

abc + + + + + + + 


Figura 15.4: Vista geométrica de 2°. 


Es útil analizar e ilustrar la geometría del factorial 2? del mismo modo que se hizo 
para el factorial 2? en la figura 15.1. Para el 2? los ocho puntos de diseño representan los 
vértices de un cubo, como se observa en la figura 15.4. 

Las columnas de la tabla 15.5 representan los signos que se utilizan para los con- 
trastes, así como los cálculos de siete efectos y las sumas de cuadrados correspondientes. 
Estas columnas son análogas a las que se observan en la tabla 15.4 para el caso de 22. 
Como son ocho puntos de diseño hay siete efectos disponibles. Por ejemplo, 


a +ab + ac + abc — (1) — b — c — Бс 


A= 
4n 
AB = A A 
n 


y así sucesivamente. Las sumas de cuadrados son dadas por 


(contraste)? 


SC(efecto) = 737 


Al observar la tabla 15.5 se revela que para el experimento 2° todos los contrastes 
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entre los siete son mutuamente ortogonales y, por lo tanto, los siete efectos se evalúan en 
forma independiente. 


Efectos y sumas de cuadrados para el 2* 


Para un experimento factorial 2* las sumas de cuadrados de un solo grado de libertad 
para los efectos principales y los efectos de interacción se obtienen elevando al cuadrado 
los contrastes apropiados en los totales del tratamiento y dividiendo entre 2*n, donde n 
es el número de réplicas de las combinaciones del tratamiento. 

Сото antes, un efecto siempre se calcula restando la respuesta promedio en el nivel 
“bajo”, de la respuesta promedio en el nivel “alto”. Quedan muy claros los niveles alto y 
bajo para los efectos principales. Los niveles alto y bajo simbólicos para las interaccio- 
nes son evidentes a partir de la información de la tabla 15.5. 

La propiedad de ortogonalidad tiene la misma importancia aquí que en el material 
sobre las comparaciones que se estudió en el capítulo 13. La ortogonalidad de los con- 
trastes implica que los efectos estimados y, por lo tanto, las sumas de cuadrados, son 
independientes. Esta independencia se ilustra con claridad en el experimento factorial 2* 
si las respuestas, con el factor A en su nivel alto, se incrementan en una cantidad x en la 
tabla 15.5. Sólo el contraste A conduce a una suma de cuadrados más grande, ya que el 
efecto x se cancela cuando se forman los seis contrastes restantes como resultado de los 
dos signos positivos y los dos negativos asociados con las combinaciones de tratamien- 
tos en los que A está en el nivel alto. 

La ortogonalidad produce otras ventajas, las cuales se abordarán cuando se estudie 
el experimento factorial 2* en situaciones de regresión. 


15.3 Experimento factorial 2* sin réplicas 


El factorial completo 2* con frecuencia requiere mucha experimentación, en particular 
cuando k es grande. Como resultado, a menudo no es posible replicar cada combinación 
de factores. Si en el modelo del experimento se incluyen todos los efectos, con todas las 
interacciones, no se permite ningún grado de libertad para el error. A menudo, cuando k 
es grande, el analista de datos agrupará las sumas de los cuadrados y los grados de liber- 
tad correspondientes para las interacciones de orden superior que se sabe, o se supone, 
son despreciables. Esto producirá pruebas F para los efectos principales e interacciones 
de orden inferior. 


Graficación de diagnóstico con experimentos factoriales 2* sin réplicas 


Las gráficas de probabilidad normal constituyen una metodología muy útil para deter- 
minar la importancia relativa de los efectos en un experimento con factores de dos nive- 
les razonablemente grandes cuando no hay réplica. Este tipo de gráfica de diagnóstico 
puede ser útil sobre todo cuando el analista de datos duda en agrupar interacciones de 
orden superior por temor de agrupar en el “error” algunos efectos verdaderamente reales 
y no sólo aleatorios. El lector debe recordar que todos los efectos que no son reales, es 
decir, que son estimados de cero independientes, siguen una distribución normal con 
media cercana a cero y varianza constante. Por ejemplo, en un experimento factorial 2* 
se debe recordar que todos los efectos, teniendo en cuenta que n = 1, son de la forma 


contraste 
АВ = —¿— = Ya ж 
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donde Ya es el promedio de ocho corridas experimentales independientes en el nivel alto, 
o “+”, y y, es el promedio de ocho corridas independientes en el nivel bajo, o “—”. Así, 
la varianza de cada contraste es Маг(ур — Y.) = 02/4. Para cualesquiera efectos reales 
Е(н — Yı ) F0. Así, la gráfica de probabilidad normal debería revelar efectos “signi- 
ficativos” como aquellos que caen fuera de la línea recta que describe realizaciones de 
variables aleatorias normales independientes distribuidas de forma idéntica. 

La gráfica de probabilidad puede adoptar una de muchas formas. Se recomienda al 
lector que consulte el capítulo 8, en el que se presentaron dichas gráficas por primera 
vez. Se puede usar la gráfica cuantil-cuantil, normal y empírica. También es posible 
utilizar el procedimiento de graficación que emplea el papel de probabilidad normal. 
Además, existen otros tipos de gráficas de probabilidad normal para el diagnóstico. 
En resumen, las gráficas de efectos para el diagnóstico son como sigue. 


Gráficas 1. Calcular los efectos como 
de efectos 
de probabilidad efecto = 
para experimentos 
factoriales 2* sin 
réplica 


contraste 
2k-1 ' 


2. Construir una gráfica de probabilidad normal de todos los efectos. 


3. Los efectos que caigan fuera de la línea recta deben considerarse reales. 


A continuación se hacen más comentarios respecto de las gráficas de probabilidad 
normal de los efectos. En primer lugar, el analista podría sentirse frustrado si utiliza las 
gráficas con un experimento pequeño. Por otro lado, la graficación puede proporcionar 
resultados satisfactorios cuando hay dispersión de efectos, muchos efectos que no son 
verdaderamente reales. Esta dispersión será evidente en experimentos grandes, en los 
que es poco probable que las interacciones de orden superior sean reales. 


Estudio de caso 15.1: | Moldeado por inyección. Muchas empresas fabricantes de Estados Unidos y otros paí- 
ses utilizan partes moldeadas como componentes de un proceso. Un problema grande 
que enfrentan con frecuencia es el rebasamiento. A menudo, un molde troquelado de una 
parte se construye con un tamaño más grande que el nominal para permitir que se con- 
traiga. En la siguiente situación experimental se produce un molde nuevo para el cual es 
importante encontrar las especificaciones adecuadas del proceso para minimizar la con- 
tracción. En el siguiente experimento los valores de la respuesta son desviaciones de los 
nominales, es decir, contracciones. Los factores y niveles son los siguientes: 


Niveles codificados 


—1 +1 
A. Velocidad de inyección (pies/seg) 1.0 2.0 
B. Temperatura de moldeado (*C) 100 150 
C. Presión de moldeado (psi) 500 1000 
D. Contrapresión (psi) 75 120 


El propósito del experimento fue determinar cuáles efectos (principales y de inte- 
racción) influyen en la contracción. El experimento se consideró un filtrado preliminar a 
partir del cual se determinaron los factores para un análisis más completo. Asimismo, se 
espera obtener información respecto a cómo los factores importantes repercuten en la con- 
tracción. En la tabla 15.6 se presentan los datos de un experimento factorial 2* sin réplica. 
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Tabla 15.6: Datos para el estudio de caso 15.1 


Combinación Respuesta Combinación Respuesta 
de factores (cm x 10%) de factores (cm x 10%) 
(1) 72.68 d 73.52 
a 71.74 ad 75.97 
b 76.09 bd 74.28 
ab 93.19 abd 92.87 
с 71.25 cd 79.34 
ac 70.59 acd 75.12 
bc 70.92 bed 79.67 
abc 104.96 abcd 97.80 


Inicialmente se calcularon los efectos y se plasmaron en una gráfica de probabilidad 
normal. Los efectos calculados son los siguientes: 


A = 10.5613, BD = —2.2787, B = 12.4463, 

C = 2.4138, D = 2.1438, AB = 11.4038, 
AC = 1.2613, АР = —1.8238, ВС = 1.8163, 
CD = 1.4088, ABC = 2.8588, ABD = -—1.7813, 


ACD = —3.0438, BCD = -—0.4788, ABCD = —1.3063. 
En la figura 15.5 se observa la gráfica cuantil-cuantil normal, la cual parece implicar que 
los efectos A, B y AB son importantes. Los signos de los efectos importantes indican las 


conclusiones preliminares. 


2 


Cuantiles teóricos 
[=] 


-3 —1 1 3 5 7 9 11 13 
Cuantiles de los efectos 


Figura 15.5: Gráfica cuantil-cuantil normal de los efectos para el estudio 
de caso del ejemplo 15.1. 
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1. Un incremento en la velocidad de inyección de 1.0 a 2.0 aumenta la contracción. 


2. Un aumento en la temperatura de moldeado de 100°C a 150°C incrementa la con- 
tracción. 


3. Hay una interacción entre la velocidad de inyección y la temperatura del moldea- 
do; aunque ambos efectos principales son importantes es crucial entender el efecto 
de la interacción de los dos factores. 2 


Interpretación de la interacción de dos factores 
Como se esperaría, una tabla de medias de dos factores facilita la interpretación de la 


interacción AB. Considere la situación de dos factores de la tabla 15.7. 


Tabla 15.7: Ilustración de una interacción de dos factores 


B (temperatura) 
A (velocidad) 100 150 
2 73.355 97.205 
1 74.1975 75.240 


Observe que la media muestral grande a velocidad y temperatura elevadas creó la 
interacción significativa. La contracción se incrementa en forma no aditiva. La tem- 
peratura del moldeado parece tener un efecto positivo a pesar del nivel de velocidad. Sin 
embargo, el efecto es el mayor a velocidad elevada. El efecto de la velocidad es muy 
ligero a temperaturas bajas, pero es claramente positivo a una temperatura elevada de 
moldeado. Para controlar la contracción a bajo nivel debería evitarse el uso simultáneo 
de una alta velocidad de inyección y una temperatura de moldeado elevada. Todos estos 
resultados se ilustran en forma gráfica en la figura 15.6. 
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Figura 15.6: Gráfica de la interacción para el estudio de caso 15.1. 
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Análisis con el cuadrado medio del error agrupado: salida 
de resultados por computadora comentada 


Puede ser de interés observar un análisis de varianza de los datos del moldeado por inyec- 
ción con interacciones de orden superior agrupadas para formar un cuadrado medio del 
error. Las interacciones de órdenes tres y cuatro están agrupadas. En la figura 15.7 se obser- 
va una salida de resultados por computadora de la función PROC GLM del SAS. El análisis 
de varianza revela, en esencia, la misma conclusión que la gráfica de probabilidad normal. 
Las pruebas y los valores P que se observan en la figura 15.7 requieren una interpre- 
tación. Un valor P significativo sugiere que el efecto difiere de cero en forma significa- 
tiva. Las pruebas sobre los efectos principales (que en presencia de las interacciones se 
pueden considerar como los efectos promediados sobre los niveles de los demás factores) 
indican la significancia de los efectos A y B. Los signos de los efectos también son im- 
portantes. Un aumento en el nivel de bajo a alto en A, la velocidad de inyección, ocasiona 


The GLM Procedure 


Dependent Variable: y 


Source 
Model 
Error 


Sum of 
DF Squares Mean Square F Value Рг > Е 
10 1689.237462 168.923746 9.37 0.0117 


5 90.180831 18.036166 


Corrected Total 15 1779.418294 


R-Square 
0.949320 
Source 


Parameter 
Intercept 


Coeff Var Root MSE y Mean 
5.308667 4.246901 79.99938 


DF Type III SS Mean Square F Value Pr > Е 


1 446.1600062 446.1600062 24.74 0.0042 
1 619.6365563 619.6365563 34.36 0.0020 
1 23.3047563 23.3047563 1:229 0.3072 
1 18.3826563 18.3826563 1.02 0.3590 
1 520.1820562 520.1820562 28.84 0.0030 
1 6.3630063 6.3630063 0.35 0.5784 
1 13.3042562 13.3042562 0.74 0.4297 
1 13.1950562 13.1950562 0.73 0.4314 
1 20.7708062 20.7708062 12:15 0.3322 
1 7.9383063 7.9383063 0.44 0.5364 
Standard 
Estimate Error t Value Pr > |t] 
79-99937500 106172520 75.35 <.0001 
5.28062500 1.06172520 4.97 0.0042 
6.22312500 1.06172520 5.86 0.0020 
1.20687500 1.06172520 1.14 0.3072 
1.07187500 1.06172520 1.01 0.3590 
5.70187500 1.06172520 5.37 0.0030 
0.63062500 1.06172520 0.59 0.5784 
0.91187500 1.06172520 -0.86 0.4297 
0.90812500 1.06172520 0.86 0.4314 
1.13937500 1.06172520 -1.07 0.3322 
0.70437500 1.06172520 0.66 0.5364 


Figura 15.7: Salida de resultados por computadora del SAS para los datos del estudio de caso 15.1. 


Ejercicios 


609 


un incremento en la contracción. Lo mismo es verdad para B. Sin embargo, debido a la 
interacción significativa AB, las interpretaciones del efecto principal podrían considerarse 
como tendencias en todos los niveles de los demás factores. El impacto de la interacción 
AB significativa se entiende mejor si se emplea una tabla de medias de dos factores. 


Ejercicios 


15.1 Los siguientes datos se obtuvieron de un expe- 
rimento factorial 2° que se replicó tres veces. Utilice 
el método del contraste para evaluar las sumas de cua- 
drados de todos los efectos factoriales. Saque sus con- 
clusiones. 


Combinación Réplica Réplica Réplica 

de tratamientos 1 2 3 
(1) 12 19 10 

a 15 20 16 

b 24 16 17 

ab 23 17 27]. 

С 17 25 21 

ас 16 19 19 

bc 24 23 29 

abc 28 25 20 


15.2 Enunexperimento efectuado porel Departamento 
de Ingeniería de Minas de Virginia Tech con el fin de 
estudiar un sistema de filtrado particular para carbón se 
agregó un coagulante a la solución contenida en un tan- 
que con carbón y sedimentos, que luego se puso en un 
sistema de recirculación para purificar el carbón. En el 
proceso experimental se variaron tres factores: 


Factor A: porcentaje de sólidos que circularon 
inicialmente en el sobreflujo 

Factor B: tasa de flujo del polímero 

Factor C: pH del tanque 


La cantidad de sólidos en el flujo inferior del sistema 
de purificación determina qué tan puro ha quedado el 
carbón. Se emplearon dos niveles de cada factor y se 
hicieron dos corridas experimentales para cada una de 
las 2° = 8 combinaciones. En la siguiente tabla se es- 
pecifican las mediciones de respuesta en porcentajes de 
sólidos por peso: 


Combinación Respuesta 

de tratamientos Réplica 1 Réplica 2 
(1) 4.65 5.81 
a 21.42 21,35 
Ь 12.66 12.56 
аЬ 18.27 16.62 
а 7.93 7.88 
ас 13.18 12.87 
be 6.51 6.26 
abc 18.23 17.83 


Suponga que todas las interacciones son potencial- 
mente importantes y con base en esto haga un análisis 
completo de los datos. Use valores P en la conclusión. 


15.3 En un experimento metalúrgico se desea probar 
el efecto de cuatro factores y sus interacciones sobre la 
concentración (porcentaje por peso) de cierto compuesto 
particular de fósforo en el material de fundición. Las 
variables son A, porcentaje de fósforo en la refinación; 
B, porcentaje del material vuelto a fundir; C, tiempo de 
flujo; y D, tiempo de espera. Se varían los cuatro fac- 
tores en un experimento factorial 2*, con dos fundicio- 
nes tomadas de cada combinación de factores. Las 32 
fundiciones se hicieron en orden aleatorio. Los datos se 
muestran en la siguiente tabla, y en la figura 15.8 de la 
página 610 se incluye la tabla del ANOVA. Analice los 
efectos de los factores y sus interacciones sobre la con- 
centración del compuesto de fósforo. 


Peso 

Combinación % de compuesto de fósforo 
de tratamientos Réplica 1 Réplica 2 Total 
(1) 30.3 28.6 58.9 

а 28.5 314 59.9 

Ь 24.5 25.6 50.1 

ab 25.9 27.2 53.1 

© 24.8 23.4 48.2 

ас 26.9 23.8 50.7 

bc 24.8 27.8 52.6 

abc 22.2 24.9 47.1 

d 31:7 33.5 65.2 

ad 24.6 26.2 50.8 

bd 27.6 30.6 58.2 

abd 26.3 27.8 54.1 

cd 29.9 27.1 57.6 

аса 26.8 24.2 51.0 

Ьса 26.4 24.9 91:9 

abcd 26.9 29.3 56.2 
Total 428.1 436.9 865.0 


15.4 Se realizó un experimento preliminar para estu- 
diar los efectos de cuatro factores y sus interacciones 
sobre la producción de la operación de cierta máquina. 
Se realizan dos corridas de cada una de las combinacio- 
nes de tratamientos para obtener una medida del error 
experimental puro. Se emplean dos niveles de cada 
factor y se obtienen los datos que se observan en la 
siguiente página. Pruebe todos los efectos principales 
y las interacciones a un nivel de significancia de 0.05. 
Saque sus conclusiones. 
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Fuente de Suma de Grados de Cuadrado / 
уагїасїбп Efectos cuadrados libertad medio calculada Valor P 


Efecto principal: 


A — 1.2000 11.52 1 11.52 4.68 0.0459 
B — 1.2250 12.01 1 12.01 4.88 0.0421 
C — 2.2250 39.61 1 39.61 16.10 0.0010 
D 1.4875 17.70 1 17.70 7.20 0.0163 
Interacción de dos factores: 
AB 0.9875 7.80 1 7.80 3.17 0.0939 
AC 0.6125 3.00 1 3.00 1.22 0.2857 
AD — 1.3250 14.05 1 14.05 5.71 0.0295 
ВС 1.1875 11.28 1 11.28 4.59 0.0480 
BD 0.6250 318 1 3.13 1.27 0.2763 
CD 0.7000 3.92 1 3.92 1.59 0.2249 
Interacción de tres factores: 
ABC — 0.5500 2.42 1 2.42 0.98 0.3360 
ABD 1.7375 24.15 1 24.15 9.82 0.0064 
АСР 1.4875 17.70 1 17.70 7.20 0.0163 
BCD — 0.8625 5:95 1 5.95 2.42 0.1394 
Interacción de cuatro factores: 
ABCD 0.7000 3.92 1 3.92 1.59 0.2249 
Error 39.36 16 2.46 
Total 217.51 31 


Figura 15.8: Tabla ANOVA para el ejercicio 15.3. 


Combinación un análisis con ciertos niveles de ciertas variables de 
de tratamientos Réplica 1 Réplica 2 procesamiento. A continuación se presentan los datos. 
0) 7.9 9.6 Obser- Estado Tiempo de Vel.de Condición 
a 0 е. vación físico mezclado las aspas de nitrógeno Aluminio 
c 10.4 12.0 l] 1 a 2 > 16.3 
d 7.1 8.3 2 1 2 2 2 16.0 
ab 11.1 12.3 > . | | н 162 
ac 16.4 15.5 4 1 2 | lea 
ad zi 57 5 1 1 І 2 16.0 
be 12.6 15.2 6 ] 2 | і е 
bd da 58 7 1 2 2 1 15.5 
cd 7.4 10.9 a l l 2 l о 
abc 21.9 21.9 y 2 1 2 2 ү 
Ahi 98 “Ж 10 2 2 2 2 16.1 
аса 13.8 11.2 A o ] a | 16:3 
bed 10.2 11.1 o o a | 2 18 
abcd 12.8 14.3 па l l 2 pe 
14 2 2 1 1 15.9 
К 15 2 2 2 1 15.6 
15.5 En el estudio An X-Ray Fluorescence Method 16 2 1 2 1 15.8 


for Analyzing Polybutadiene-Acrylic Acid (PBAA) 

Propellants (Quarterly Reports, RK-TR-62-1, Army Las variables para los datos son: 
Ordnance Missile Command) se realizó un experi- A: tiempo de mezcla 

mento para determinar si existe o no una diferencia nivel 1: 2 horas 
significativa en la cantidad de aluminio obtenido en nivel 2: 4 horas 


Ejercicios 


B: Velocidad de las aspas 
nivel 1: 36 rpm 
nivel 2: 78 rpm 
C: Condición de nitrógeno que pasa por el propulsor 
nivel 1: seco 
nivel 2: 72% de humedad relativa 
D: estado físico del propulsor 
nivel 1: no refinado 
nivel 2: refinado 


Analice los datos suponiendo que todas las interaccio- 
nes de tres y cuatro factores son despreciables. Utilice 
un nivel de significancia de 0.05. Escriba un breve in- 
forme que resuma sus hallazgos. 


15.6 Es importante estudiar el efecto de la concen- 
tración del reactivo y la tasa de alimentación de la vis- 
cosidad del producto de cierto proceso químico. La 
concentración del reactivo será el factor A a los niveles 
15% y 25%. La tasa de alimentación será el factor B a 
niveles de 20 lb/h y 30 lb/h. El experimento implica 2 
corridas experimentales en cada una de las cuatro com- 
binaciones (L = bajo y H = alto). Las lecturas de la 
viscosidad son las siguientes. 


Н | 132 149 
137 152 
В 
145 154 
L| 147 150 
Г. H 
A 


a) Suponga un modelo que contiene dos efectos prin- 
cipales y una interacción y calcule los tres efectos. 
¿Tiene usted alguna interpretación en este mo- 
mento? 

b) Realice un análisis de varianza y haga pruebas de 
interacción. Saque conclusiones. 

c) Realice pruebas para los efectos principales y sa- 
que conclusiones finales acerca de la importancia 
de todos estos efectos. 


15.7 Considere el ejercicio 15.3. Al investigador no 
sólo le interesa saber que las interacciones AD, BC y 
quizá AB son importantes, sino también su significado 
científico. Dibuje gráficas de interacción bidimensional 
para las tres e interprételas. 


15.8 Considere nuevamente el ejercicio 15.3. Es fre- 
cuente que las interacciones de tres factores no sean 
significativas y, aun si lo fueran, serían difíciles de in- 
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terpretar. La interacción ABD parece ser importante. 
Para hacer cierta interpretación dibuje dos gráficas de 
la interacción AD, una para В = —1 y otra para B = 
+1. A partir de la apariencia de éstas interprete la in- 
teracción ABD. 


15.9 Considere el ejercicio 15.6. Utilice una escala 
de +1 y —1, para “alto” y “bajo”, respectivamente, y 
calcule una regresión lineal múltiple con el modelo 


Y, = Bo + бух + 8х2; + B12X1iX2i + €i, 


соп х, = concentración del reactivo (—1, +1) y x,, = 
tasa de alimentación (—1, +1). 
a) Calcule los coeficientes de regresión. 
b) ¿Cómo se relacionan los coeficientes b,, b, y b,, 
con los efectos que encontró en el ejercicio 15.6a)? 
с) En su análisis de regresión haga pruebas 1 sobre b,, 
b, y b,, ¿Cómo se relacionan estos resultados de 
la prueba con los del ejercicio 15.6b) y c)? 


15.10 Considere el ejercicio 15.5. Calcule los 15 efec- 

tos y haga gráficas de probabilidad normal de los efectos. 

a) ¿Parece válida la suposición de que las interaccio- 
nes de tres y cuatro factores son despreciables? 

b) ¿Los resultados de las gráficas del efecto son con- 
sistentes con lo que usted planteó sobre la impor- 
tancia de los efectos principales y las interacciones 
de dos factores en su informe de resumen? 


15.11 En Myers, Montgomery y Anderson-Cook 
(2009) se analiza un conjunto de datos para el que un 
ingeniero empleó un factorial 2* con el fin de estudiar 
los efectos de la velocidad de corte (4), la geometría 
de la herramienta (В) y el ángulo de corte (С) sobre la 
vida (en horas) de una máquina. Se eligen dos niveles de 
cada factor y se hacen pruebas dobles en cada punto del 
diseño en un orden aleatorio. A continuación se presen- 
tan los datos. 


A B C Vida 
(1) = = — 22,31 
а + = = 32,43 
b = + — 35,34 
ab + + — 35,47 
с = — + 4445 
ас + — + 40,37 
be = + + 60,50 
ас + + + 39, 41 


a) Calcule los siete efectos. Con base en su magni- 
tud, ¿cuál parece ser importante? 

b) Haga un análisis de varianza y observe los valores 
P. 

c) ¿Coinciden los resultados de los incisos a y b? 
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d) El ingeniero confía en que debe haber una inte- 
racción entre la velocidad y el ángulo de corte. Si 
esta interacción es significativa, dibuje una gráfica 
de la interacción y analice su significado desde el 
punto de vista de la ingeniería. 


15.12 Considere el ejercicio 15.11 y suponga que 
hubo cierta dificultad experimental para hacer las co- 
rridas; que en realidad se tuvo que suspender todo el 
experimento después de sólo cuatro corridas. Como re- 
sultado, el experimento abreviado es dado por 


Vida 
a 43 
b 35 
с 44 
abc 39 
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Con sólo estas corridas los signos para los contrastes 
son dados por 


A B C AB АС ВС АВС 
а +- - - - + + 
b =- + - —- + - + 
с > + = = F 
ac + + + + + + + 


Comente y determine si los contrastes son o no ortogo- 
nales. ¿Cuáles lo son y cuáles no? ¿Los efectos prin- 
cipales son ortogonales entre sí? En ese experimento 
abreviado (denominado factorial fraccionario) ¿es po- 
sible estudiar las interacciones de los efectos principales 
en forma independiente? ¿Se trataría de un experimento 
útil si estuviéramos convencidos de que las interaccio- 
nes son despreciables? Explique su respuesta. 


15.4 Experimentos factoriales en un ajuste de regresión 


Hasta ahora hemos limitado el análisis de los datos para un factorial 2* al método del 
análisis de varianza. La única referencia a un análisis alternativo se hizo en el ejercicio 
15.9 de la página 611. De hecho, este ejercicio introduce gran parte del material que 
da origen a la presente sección. Hay situaciones en las que el ajuste de un modelo es 
importante y en la que es posible controlar los factores que se estudian. Por ejemplo, 
un biólogo podría querer estudiar el crecimiento de cierto tipo de alga en el agua, en 
cuyo caso sería muy útil un modelo que relacionara las unidades de algas como una 
función de la cantidad de cierto contaminante, y, digamos, del tiempo. Así, el estudio 
involucra un experimento factorial en un ambiente de laboratorio en el que los factores 
son la concentración del contaminante y el tiempo. Como se verá más adelante en esta 
sección, es posible ajustar un modelo más preciso si los factores están controlados en 
un arreglo factorial, para el que con frecuencia es útil elegir un factorial 2*. En muchos 
procesos biológicos y químicos los niveles de las variables regresoras pueden y deberían 


controlarse. 


Hay que recordar que el modelo de regresión empleado en el capítulo 12 se puede 
escribir con notación de matriz de la siguiente manera 


у= ХВ + є. 


La matriz X se denomina matriz del modelo. Suponga, рог ejemplo, que se utiliza un 
experimento factorial 23 con las variables 


Temperatura: 150°C 200°C 
Humedad: 15% 20% 
Presión (psi): 1000 1500 


Los niveles familiares +1 y — 1 se generan a través del siguiente centrado y escalado 


a unidades de diseño: 


temperatura — 175 
Xx] = > 


25 


humedad — 17.5 


_ presión — 1250 
2.5 | В | 


dd 250 
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Como resultado, la matriz X se vuelve 


Ху Хз B Identificación del diseño 


1 =1 =1 =l (1) 
1 тыг ы а 
{б = i .=1 Ь 
| її 1 с 
X= || || | ab 
1 1 —1 1 ac 
1—1 1 1 bc 
1 1 1 1 abc 


Ahora se observa que los contrastes ilustrados y analizados en la sección 15.2 están 
relacionados directamente con los coeficientes de regresión. Observe que todas las co- 
lumnas de la matriz X en el ejemplo 2° son ortogonales. Como resultado, el cálculo de 
los coeficientes de regresión que se describió en la sección 12.3 se convierte en 


bo 

b= bi = (Х'Х) Xy = ы X'y 
bz 8 
b3 


a +ab+ac+abc+(1)+b+c+bce 
_ l а+аь +ас + арс = (1) —b-— c = bc 
8 |р+ар +рс+аьс-– (1) -a-c ac | 
с+ас + be + арс = (1) – а= Б —ab 


donde а, ab, etc., son medidas de la respuesta. 

Ahora se observa que el concepto de principales efectos calculados que se enfatiza 
a lo largo de todo este capítulo con diseños factoriales 2*, se relaciona con los coeficien- 
tes de un modelo de regresión ajustado cuando los factores son cuantitativos. De hecho, 
para un 2% con, digamos, n corridas experimentales por punto del diseño, las relaciones 
entre los efectos y los coeficientes de regresión son como sigue: 


contraste 
Efecto = 2— 
2k-1 ( n) 
Я ‚2, contraste efecto 
Coeficiente de regresión = = 
2*(п) 2 


Esta relación debería tener sentido para el lector, уа que un coeficiente de regresión 
b, es una tasa promedio del cambio en la respuesta por cambio de unidad en ху Por su- 
puesto, cuando se va de —1 a +1 en Хх, (de bajo a alto), la variable de diseño cambia en 
2 unidades. 


Ejemplo 15.2: | Considere un experimento donde un ingeniero desea ajustar una regresión lineal del 
producto y contra el tiempo de retención x, y el tiempo de flexión x, en cierto sistema 
químico. Todos los demás factores se mantienen fijos. Los datos en las unidades natura- 
les se incluyen en la tabla 15.8. Estime el modelo de regresión lineal múltiple. 

Solución: El modelo de regresión ajustado es 
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Tabla 15.8: Datos para el ejemplo 15.2 


Tiempo de retención (hr) Tiempo de flexión(hr) Producto (%) 


0.5 0.10 28 
0.8 0.10 39 
0.5 0.20 32 
0.8 0.20 46 


Las unidades de diseño son 


tiempo de retención — 0.65 tiempo de flexión — 0.15 
x= ; X= 
| 0.15 ? 0.05 


y la matriz X es 


^1 х2 
1 —1 —1 
1 1 —1 
1 —1 1 
1 1 1 
con los coeficientes de regresión 
(1) + a+b+ab 
bo 4 36.25 
b| =(х'х)-!Х'у = mo кыр 625. 
ba b+ab=(1) —a 5 
4 


Así, la ecuación de regresión de mínimos cuadrados es 
ў = 36.25 + 6.25x, + 2.75х,. 


Este ejemplo ilustra el uso del experimento factorial de dos niveles en un ajuste de 
regresión. Las cuatro corridas experimentales en el diseño 2? se usaron para obtener una 
ecuación de regresión, con la interpretación evidente de los coeficientes de regresión. El 
valor b, = 6.25 representa el incremento estimado en la respuesta (porcentaje de produc- 
ción) por cambio en la unidad de diseño (0.15 horas) en el tiempo de retención. El valor 
b, = 2.75 representa una tasa de cambio similar para el tiempo de flexión. 


Interacción en el modelo de regresión 


Los contrastes de interacción que se estudiaron en la sección 15.2 tienen interpretaciones 
definidas en el contexto de la regresión. De hecho, las interacciones se explican en los 
modelos de regresión en términos de producto. Esto se ilustra en el ejemplo 15.2, en 
donde el modelo con interacción es 

у = b, + bx + bx, baxx 


22 12772 


соп b, b, y b,, como antes, y 


ab+ (1) =a=b 46428 – 39 =32 


bm = 
12 4 4 


= 0.75, 


15.4 Experimentos factoriales en un ajuste de regresión 615 


Así, la ecuación de regresión que expresa dos efectos principales lineales e interacción, es 
ў = 36.25 + 6.25x, + 2.75х, + 0.75x x, 


El contexto de la regresión proporciona un marco de referencia mediante el cual el 
lector debería entender mejor la ventaja de la ortogonalidad de que goza el factorial 2*. 
En la sección 15.2 se analizaron las ventajas de la ortogonalidad desde el punto de vista del 
análisis de varianza de los datos en un experimento factorial 2*, Se señaló que la ortogo- 
nalidad entre los efectos conduce a la independencia entre las sumas de cuadrados. Desde 
luego, la presencia de variables de regresión no descarta el uso del análisis de varianza. 
De hecho, las pruebas f se llevan a cabo tal como se describió en la sección 15.2. No obs- 
tante, se debe hacer una distinción. En el caso del ANOVA las hipótesis surgen de medias 
poblacionales, mientras que en el caso de la regresión las hipótesis implican coeficientes 
de regresión. 

Por ejemplo, considere el diseño experimental del ejercicio 15.2 de la página 609. 
Cada factor es continuo. Suponga que los niveles son 


A(x): 20% 50% 
B (х,): 5 lb/sec 10 lb/sec 
Су: 5 30 
y que se tiene, para los niveles de diseño, 
_ % sólidos — 30 _ tasa de flujo — 7.5 _ рН — 5.25 
G T E 25 ЭЕ Миз 


Suponga que es de interés ajustar un modelo de regresión múltiple, en el cual se con- 
siderarán todos los coeficientes lineales y las interacciones disponibles. Además, el in- 
geniero desea obtener información acerca de cuáles niveles del factor maximizarán la 
purificación, es decir, maximizar la respuesta. Este problema es el tema del estudio de 
caso 15.2, 


Estudio de caso 15.2: | 


Experimento de purificación del carbón:' La figura 15.9 representa una salida de re- 
sultados comentados del análisis de regresión del modelo ajustado 


XX + Ь ‚хх, + bx, Eb xxx 


12172 1312 232 23 1231232 


5 =b + bx + bx, + bx, +b 


donde x,, х, y x, representan al porcentaje de sólidos, la tasa de flujo y el pH del sistema, 
respectivamente. Se utilizó la función PROC REG del sistema de cómputo SAS. 

Observe los estimados del parámetro, el error estándar y los valores P en la salida de 
resultados por computadora. Los estimados del parámetro representan los coeficientes del 
modelo. Todos ellos son significativos, excepto el término x,x, (interacción BC). También 
observe que los residuales, los intervalos de confianza y los intervalos de predicción apa- 
recen como se presentaron en el material sobre regresión de los capítulos 11 y 12. 

El lector puede usar los valores de los coeficientes del modelo y los valores pro- 
nosticados en la salida de resultados por computadora para asegurarse de que la com- 
binación de los factores dé como resultado la mayor eficiencia de pureza. El factor 
A (porcentaje de sólidos circulados) tiene un coeficiente positivo alto, lo cual sugiere 
un valor elevado para el porcentaje de sólidos. Además, se sugiere un valor bajo para 
el factor C (pH del tanque). Aunque el coeficiente del efecto principal B (tasa de flujo 


IVéase el ejercicio 15.2. 
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Dependent Variable: Y 
Analysis of Variance 


Sum of Mean 
Source DF Squares Square F Value Pr > F 
Model 7 490.23499 70.03357 254.43 <.0001 
Error 8 2.20205 0.27526 
Corrected Total 15 492.43704 
Root MSE 0.52465 R-Square 0.9955 
Dependent Mean 12.75188 Adj R-Sq 0.9916 
Coeff Var 4.11429 


Parameter Estimates 
Parameter Standard 


Variable DF Estimate Error t Value Рг > |+| 

Intercept 1 12.75188 0.13116 97.22 <.0001 

A 1 4.71938 0.13116 35.98 <.0001 

B 1 0.86563 0.13116 6.60 0.0002 

С 1 -1.41563 0.13116 -10.79 <.0001 

AB 1 -0.59938 0.13116 -4.57 0.0018 

AC 1 -0.52813 0.13116 -4.03 0.0038 

BC 1 0.00562 0.13116 0.04 0.9668 

ABC 1 2.23063 0.13116 17.01 <.0001 

Dependent Predicted Std Error 

Obs Variable Value Mean Predict 9 5% CL Mean 95% CL Predict Residual 
4.6500 5.2300 0.3710 4.3745 6.0855 3.7483 6.7117 -0.5800 
21.4200 21.3850 .3710 20.5295 22.2405 19.9033 22.8667 0.0350 
12.6600 12.6100 .3710 11.7545 13.4655 11.1283 14.0917 0.0500 
18.2700 17.4450 .3710 16.5895 18.3005 15.9633 18.9267 0.8250 
7.9300 7.9050 .3710 7.0495 8.7605 6.4233 9.3867 0.0250 
13.1800 13.0250 ¿3710 12.1695 13.8805 11.5433 14:5067 0.1550 
6.5100 6.3850 +3710 5.5295 7.2405 4.9033 7.8667 0.1250 
18.2300 18.0300 3710 17.1745 18.8855 16.5483 19.5117 0.2000 
5.8100 5.2300 .3710 4.3745 6.0855 3.7483 6.7117 0.5800 


21.3500 21.3850 
12.5600 12.6100 
16.6200 17.4450 
7.8800 7.9050 
12.8700 13.0250 
6.2600 6.3850 
17.8300 18.0300 


.3710 20.5295 22.2405 19.9033 22.8667 -0.0350 
.3710 11.7545 13.4655 11.1283 14.0917 -0.0500 
.3710 16.5895 18.3005 15.9633 18.9267 -0.8250 
.3710 7.0495 8.7605 6.4233 9.3867 -0.0250 
.3710 12.1695 13.8805 11.5433 14.5067 -0.1550 
.3710 5.5295 7.2405 4.9033 7.8667 -0.1250 
.3710 17.1745 18.8855 16.5483 19.5117 -0.2000 


о о ос со сб о оо о ©з с со ооо о о 


к кык ык к FE 
DO (л & ( МЮ ҥ © о СО м СУ (л > О) М y 


Figura 15.9: Lista de resultados del SAS para los datos del estudio de caso 15.2. 


del polímero) es positivo, el coeficiente positivo elevado de x,x,x, (ABC) sugiere que la 
tasa de flujo debería estar en el nivel bajo para aumentar la eficiencia. De hecho, el mo- 
delo de regresión generado en la salida de resultados por computadora del SAS sugiere 
que la combinación de factores que podrían producir resultados óptimos, o quizá sugerir 
experimentos futuros, es dada por 


A: nivel alto 
B: nivel bajo 
C: nivel bajo И | 
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15.5 El diseño ortogonal 


En situaciones experimentales en las que es apropiado ajustar modelos que son linea- 
les en las variables de diseño y que posiblemente impliquen interacciones o términos 
de producto, el diseño ortogonal de dos niveles, o arreglo ortogonal, plantea algunas 
ventajas. Por diseño ortogonal nos referimos a uno en el que hay ortogonalidad entre 
las columnas de la matriz X. Considere la matriz X para el factorial 2? del ejemplo 15.2. 
Observe que las tres columnas son mutuamente ortogonales. La matriz X del factorial 
2? también contiene columnas ortogonales. El factorial 2° con interacciones produciría 
una matriz X del tipo 


X1 X2 X3 X1X2 X1X3 X2X3 X]X2X3 
=1 -1 -1 1 1 1 —1 

1—1 -1 —1 -l 1 1 
—1 1 â l =l 1 —1 1 
-1 —1 1 1 -1 —1 1 

1 1 —1 1 -1 —1 —1 

1 —1 1 —1 1 =l —1 
—1 1 1 =r =] 1 —1 

1 1 1 1 1 1 1 


A 
Il 
- =. =. e.e. н 


La descripción de los grados de libertad es 


Fuente gl. 

Regresión 3 

Falta de ajuste 4 (00, AX) XXX) 
Error (puro) 8 

Total 15 


Los ocho grados de libertad para el error puro se obtienen a partir de las corridas du- 
plicadas en cada punto del diseño. Los grados de libertad de la falta de ajuste podrían 
considerarse como la diferencia entre el número de puntos de diseño distintos y el nú- 
mero total de términos en el modelo; en este caso hay ocho puntos y cuatro términos en 
el modelo. 


Error estándar de los coeficientes y pruebas T 


En las secciones anteriores vimos cómo el diseñador de un experimento puede aprove- 
char el concepto de ortogonalidad para diseñar un experimento de regresión con coefi- 
cientes que obtienen una varianza mínima sobre la base del costo. Debemos ser capaces 
de utilizar el material sobre la regresión que se expuso en la sección 12.4 para calcular 
estimados de las varianzas de los coeficientes y, con ello, los errores estándar. También 
resulta de interés observar la relación entre el estadístico г de un coeficiente у el estadís- 
tico F descrito e ilustrado en capítulos anteriores. 

En la sección 12.4 vimos que las varianzas y las covarianzas de los coeficientes 
aparecen en A”!, o, en términos de la notación actual, la matriz de varianza-covarianza 
de coeficientes es 


о?А-! = oX X. 


En el caso del experimento factorial 2* las columnas de X son mutuamente ortogonales, 
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lo que impone una estructura muy especial. En general, para 2' se puede escribir 
X1 X2 ps Xk X1 X2 


Хх=П +1 я ш +1 +1 с} 


donde cada columna contiene 2* о 2'n entradas, donde п es el número de réplicas de las 
corridas en cada punto del diseño. Así, la formación de X”X lleva a 


X'X = 2%п1, 


donde I es la matriz de identidad de la dimensión р, el número de parámetros del modelo. 


Ejemplo 15.3: | Considere un diseño factorial 2 con corridas por duplicado que se ajusta al modelo 
EY) = В, F P,x, F Bx, F Px, + P, Xx, F B,XX, + Вх. 


Proporcione expresiones рага los errores estándar de los estimados de mínimos cuadra- 


dos de by b, Ь,, b,, b b,, У Б 

Solución: Х| X2 X3 X1ıX2 X1X3 X2X3 
1 =i =I =l 1 1 1 

1 1 -1 -1 -1 -l 1 

t =l 1 =l =l t =l 

{1 =f а 1 1з =i = 

= || 1 1—1 ЇЇ чы =l 

1 ї =l 1 250 i =i 

E el 1 1 =: =l 1 

1 1 1 1 1 1 1 


considerando cada unidad como repetida, es decir, considerando que cada observación 
está duplicada. Como resultado, 


X'X = 16L. 
Por consiguiente, 
осу 11 
16 7 


A partir de lo anterior debe quedar claro que las varianzas de todos los coeficientes 
para un factorial 2* con n corridas en cada punto de diseño son 


2 


Год 
Var(b) = эр 


y, desde luego, todas las covarianzas son iguales а cero. Como resultado, los errores 
estándar de los coeficientes se calculan como 


1 
SA => 
7 2kn 


Sb 


donde s se calcula por medio de la raíz cuadrada del cuadrado medio del error que se 
espera obtener a partir de una réplica adecuada. Así, en nuestro caso con 2*, 


Я s(3) 
b = ja 
4 J 
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Ejemplo 15.4: | Considere el experimento metalúrgico del ejercicio 15.3 de la página 609. Suponga que 


Solución: 


el modelo ajustado es 
EY) = B, + Вх, + 8, + Box, + Вх, + Вх, + ху, 
T B, XX, + ¡EA + ¡A + ¡ER 


¿Cuáles son los errores estándar de los coeficientes de regresión de los mínimos cua- 
drados? 


Los errores estándar de todos los coeficientes para el factorial 2* son iguales, y son 
1 
Sbi = SN ор» 
que en este ejemplo es 
1 
Sp = ATA 
2/00) 


En este caso el cuadrado medio del error puro es dado por s? = 2.46 (16 grados de liber- 
tad). Entonces, 


s, = 0.28. 
J 


Los errores estándar de los coeficientes se usan para construir estadísticos г de todos 
los coeficientes. Estos valores f se relacionan con los estadísticos F del análisis de va- 
rianza. Ya se demostró que un estadístico F sobre un coeficiente, usando el factorial 2*, es 


(contraste)? 
© (Qkn)s? 


Ésta es la forma del estadístico F de la página 610 para el experimento metalúrgico (ejer- 
cicio 15.3). Es fácil comprobar que si se escribe 


b; contraste 
_ 5] га алаа 
t = —, donde b; = ЭЕП ? 


entonces 


2 (contraste)? _ 
© gp И 


Como resultado, se mantiene la relación acostumbrada entre los estadísticos t sobre los 
coeficientes y los valores F. Como era de esperarse, la única diferencia entre utilizar t y 
F para evaluar la significancia radica en el hecho de que el estadístico f indica el signo o 
la dirección del efecto del coeficiente. 

Parecería que el plan del factorial 2* se adapta a muchas situaciones prácticas a las 
cuales se ajustan modelos de regresión. Puede incluir términos lineales y de interacción, lo 
que proporciona estimados óptimos de todos los coeficientes (desde un punto de vista de 
la varianza). Sin embargo, cuando k es grande, el número de puntos del diseño requerido 
es muy grande. A menudo es posible utilizar partes del diseño total y aun así conservar la 
ortogonalidad, con todas sus ventajas. En la sección 15.6 se estudian esos diseños. 
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Una mirada más cercana a la propiedad de ortogonalidad del factorial 2* 


Ya vimos que para el caso del factorial 2* toda la información que obtiene el analista 
sobre los efectos y las interacciones principales aparece en forma de contrastes. Estas 
“2% — 1 piezas de información” conllevan un solo grado de libertad cada una y son in- 
dependientes entre sí. En un análisis de varianza se manifiestan como efectos; mientras 
que si se construye un modelo de regresión, los efectos que resultan son coeficientes de 
regresión, aparte de un factor de 2. Con cada forma de análisis es posible hacer pruebas 
de significancia y la prueba t para un efecto dado es la misma en términos numéricos que 
para el coeficiente de regresión correspondiente. En el caso del ANOVA son importantes 
la selección de las variables y la interpretación científica de las interacciones; en tanto que 
en el caso de un análisis de regresión se usa un modelo para predecir la respuesta y/o de- 
terminar cuáles combinaciones de factores o niveles son las óptimas, por ejemplo, maxi- 
mizar la producción o la eficiencia de la purificación, como en el estudio de caso 15.2. 

Resulta que la propiedad de ortogonalidad es importante, ya sea que se trate de un 
ANOVA o de una regresión. La ortogonalidad entre las columnas de X, la matriz del mo- 
delo en, digamos, el ejemplo 15.3, ofrece condiciones especiales que tienen un impacto 
importante sobre los efectos de la varianza o los coeficientes de regresión. De hecho, 
ya es evidente que el diseño ortogonal da como resultado la igualdad de varianza para 
todos los efectos o coeficientes. Es así como, para propósitos de estimación o de prueba, 
la precisión es la misma para todos los coeficientes, los efectos principales o las interac- 
ciones. Además, si el modelo de regresión sólo contiene términos lineales, por lo cual 
sólo los efectos principales son de interés, las condiciones siguientes dan como resultado 
la minimización de las varianzas de todos los efectos, o, en forma correspondiente, de 
los coeficientes de regresión de primer orden. 


Condiciones para 
varianzas 
mínimas de los 
coeficientes 


Si el modelo de regresión contiene términos no mayores de primer orden, y si los rangos 
de las variables son dados por х, € [—1, +1] para = 1, 2,..., k, entonces Var(b)/0”, 
para j = 1, 2,..., k, se minimiza si el diseño es ortogonal y todos los niveles x, del diseño 
son +1 para i = 1, 2,..., k. 


Así, en términos de los coeficientes del modelo o los efectos principales, la ortogonali- 
dad en el 2* es una propiedad muy deseable. 

Otro método para lograr una mejor comprensión del “balance” proporcionado por el 
factorial 2* consiste en observar la situación mediante una gráfica. En la figura 15.10 se 
aprecia cada uno de los contrastes ortogonales y, por lo tanto, mutuamente independien- 
tes. En las gráficas se comparan los planos de los cuadrados cuyos vértices contienen 
las respuestas etiquetadas con “+” con las que tienen el signo “—”. Las que aparecen 
en el inciso a presentan contrastes para efectos principales y deberían ser evidentes para 
el lector. Las del inciso b presentan los planos determinados рог los vértices “+” y “2” 
para los tres contrastes de interacción de dos factores. En el inciso c se aprecia la repre- 
sentación geométrica de los contrastes para la interacción de tres factores (ABC). 


Corridas centrales con diseños factoriales 2* 


En la situación en que se aplica el diseño 2* con variables continuas de diseño y se 
busca ajustar un modelo de regresión lineal, el uso de réplicas de corridas en el diseño 
central puede ser sumamente útil. De hecho, además de las ventajas que se analizarán 
a continuación, la mayoría de los científicos e ingenieros considerarían que las corridas 
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(a) Efectos principales 


(b) Interacción de dos factores 


O = – corridas 


ABC 
(c) Interacción de tres factores 


Figura 15.10: Presentación geométrica de los contrastes para el diseño factorial 2°. 
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centrales, es decir, las corridas en x= О para i = 1, 2,..., k, no sólo son una práctica 
razonable sino que además son interesantes. En muchas áreas de aplicación del diseño 
2! el científico desea determinar si sería benéfico pasar a otra región de interés en los 
factores. En muchos casos el centro, es decir, el punto (0, 0,..., 0) en los factores codifi- 
cados, con frecuencia representa las condiciones de operación actuales del proceso, o al 
menos aquellas condiciones que se consideran “óptimas para el momento”. Por lo tanto, 
a menudo el científico requerirá datos sobre la respuesta central. 


Corridas centrales y falta de ajuste 


Además del atractivo del aumento del diseño 2* con corridas centrales, otra de sus ven- 
tajas consiste en que se relaciona con la clase de modelo que se ajusta a los datos. 
Considere, por ejemplo, el caso con k = 2 que se ilustra en la figura 15.11. 


+1 


=] +1 
A(x+) 


Figura 15.11: Un diseño 2? con corridas centrales. 


Queda claro que sin las corridas centrales los términos del modelo son la inter- 
sección, x,, Х,, x,x,. Esto explica los cuatro grados de libertad del modelo producidos 
por los cuatro puntos del diseño, además de cualquier réplica. Como cada factor tiene 
información de respuesta disponible sólo en dos ubicaciones [—1, +1}, no es posible 
incluir términos “puros” de curvatura de segundo orden en el modelo, es decir, x? o 
x2. Sin embargo, la información en (0, 0) produce un grado de libertad adicional del 
modelo. Si bien este importante grado de libertad no permite que ni x? ni x3 se empleen 
en el modelo, sí permite probar la significancia de una combinación lineal de x? y x3. 
Entonces, para n corridas centrales, hay n, — 1 grados de libertad disponibles para répli- 
cas о para el error “puro”. Esto permite un estimado de т? para probar los términos del 
modelo y la significancia del único grado de libertad para la falta de ajuste cuadrático. 
El concepto aquí es muy similar al que se describió en el material sobre la falta de ajuste 
del capítulo 11. 

Para entender por completo cómo funciona la prueba de falta de ajuste suponga que 
para k = 2 el modelo verdadero contiene todo el complemento de segundo orden de los 
términos, incluyendo a x? y x3. En otras palabras, 


EV) = B, + Вх, + Bx, + „хх, + 8х1 + 8х5. 
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Ahora, considere el contraste 
Y = Уо 


donde уу, es la respuesta promedio de las ubicaciones factoriales y Yo es la respuesta 
promedio en el punto central. Es fácil demostrar (véase el ejercicio de repaso 15.46) que 


ECY — Yo) = B,, + Pa, 


y, en efecto, para el caso general con k factores, 
k 
Ely — Yo) = A 
i=l 


Como resultado, la prueba de falta de ajuste es una prueba г simple (o F = 2) con 


Уу = Уо _ Yf — Yo 


donde n, es el número de puntos factoriales y CME sólo es la varianza muestral de los 
valores de la respuesta en (0, 0, . . . , 0). 


Ejemplo 15.5: | Este ejemplo se tomó de Myers, Montgomery y Anderson-Cook (2009). Un ingeniero 
químico trata de modelar la conversión porcentual en un proceso. Hay dos variables de 
interés, el tiempo de reacción y la temperatura de reacción. En un intento por llegar al 
modelo apropiado se realiza un experimento preliminar en un factorial 2? usando la re- 
gión actual de interés en el tiempo y temperatura de reacción. Se hicieron corridas únicas 
en cada uno de los cuatro puntos factoriales, y cinco corridas en el centro del diseño con 
el fin de poder realizar una prueba de falta de ajuste para la curvatura. En la figura 15.12 
se presenta la región del diseño y las corridas experimentales sobre el producto. 

Las lecturas del tiempo y la temperatura en el centro son, desde luego, 35 minutos y 
145°C. Los estimados de los efectos principales y el coeficiente de interacción único se 
calculan mediante contrastes, igual que antes. Las corridas en el centro no intervienen 
en el cálculo de Р, b, y b,,. Esto debería ser razonable para el lector. La intersección 
es sólo y para todo el experimento. Este valor es y = 40.4444. Los errores estándar se 
calculan usando los elementos de la diagonal de (X”X)”!, como ya se expuso. Para este 


caso, 
X1 ^2 Х1Х2 
-1 —1 1 
=1[ 1 =l 
1 =l —1 


A 
І 
Ro 
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+1 


160° 40.0 41.5 


40.3, 40.5, 40.7, 40.2, 40.6 


Temperatura 


130° 39.3 40.9 
-1 +1 
30 min 40 min 


Figura 15.12: Factorial 2? con 5 corridas en el centro. 


Después de hacer los cálculos se obtiene 


b, = 40.4444, Ь = 0.7750, b, = 0.3250, Ь, = —0.0250, 
s„ = 0.06231, s, = 0.09347, з, = 0.09347, s, = 0.09347, 
= 649.07, 1, = 8.29) 1, = 3.48, 1, = —0.27 (Р = 0.800). 


b b 


El contraste уу — Yo = 40.425 — 40.46 = —0.035 y el estadístico £ que prueba la curva- 
tura son dados por 


40.425 — 40.46 


= = 0.251 P = 0.814). 
\/0.0430(1 /4 + 1/5) | ) 


Como resultado, parece que el modelo apropiado debería contener sólo términos de 
primer orden (además de la intersección). 


Una mirada intuitiva a la prueba de curvatura 


Si se considera el caso sencillo con una sola variable de diseño con corridas en —1 y 
+1 debe quedar claro que la respuesta promedio en —1 y +1 debe estar cerca de la res- 
puesta en 0, el centro, si el modelo es de primer orden. Cualquier desviación sugeriría, 
con seguridad, curvatura. Esto se puede extender fácilmente a dos variables. Considere 
la figura 15.13. 

La figura muestra el plano sobre y que pasa a través de los valores de y de los puntos 
factoriales. Éste es el plano que representaría el ajuste perfecto para el modelo que con- 
tiene X X, y x,x, Si el modelo no contiene curvatura cuadrática, es decir, B n= Bs = 0, 
se esperaría que la respuesta en (0, 0) esté en el plano o cerca del mismo. Si la respuesta 
estuviera lejos del plano, como ocurre en la figura 15.13, entonces se podría ver en forma 
gráfica que la curvatura cuadrática está presente. 


Ejercicios 
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Respuestas en (0, 0) 


Figura 15.13: Factorial 2? con corridas en (0, 0). 


Ejercicios 


15.13 Considere un experimento 2? donde se realizan 
corridas experimentales sobre 4 máquinas diferentes. 
Use las máquinas como bloques y suponga que todos 
los efectos principales y las interacciones de dos facto- 
res son importantes. 

a) ¿Cuáles corridas se harían sobre cada una de las 4 

máquinas? 
b) ¿Cuáles efectos se confunden con los bloques? 


15.14 En un experimento descrito en Myers, 
Montgomery y Anderson-Cook (2009) se buscan las 
condiciones óptimas para almacenar semen de bovi- 
nos con el fin de obtener la supervivencia máxima. Las 
variables son el porcentaje de citrato de sodio, el por- 
centaje de glicerol y el tiempo de equilibrio en horas. 
La respuesta es el porcentaje de supervivencia de los 
espermatozoides móviles. Los niveles naturales se en- 
cuentran en la referencia mencionada. A continuación 
se presentan los datos con los niveles codificados para 
la parte factorial del diseño y las corridas centrales. 

a) Ajuste un modelo de regresión lineal con los datos 
y determine cuáles términos lineales y de interac- 
ción son significativos. Suponga que la interacción 
x,x,x, es despreciable. 

b) Pruebe la falta de ajuste cuadrático y comente la 
respuesta. 


x1, % de Хз 
citrato х, % Tiempo % 
de sodio de glicerol de equilibrio Supervivencia 
—1 —1 —1 57 
1 —1 —1 40 
—1 1 1 19 
1 1 1 40 
—1 —1 —1 54 
1 —1 —1 41 
—1 1 1 21 
1 1 1 43 
0 0 0 63 
0 0 0 61 


15.15 Los productores de petróleo están interesados 
en aleaciones de níquel que sean fuertes y resistentes 
a la corrosión. Se realizó un experimento en el que se 
comparó del límite elástico especímenes elásticos de 
aleaciones de níquel cargados en una solución de ácido 
sulfúrico saturada con disulfuro de carbón. Se compa- 
raron dos aleaciones; una con 75% de níquel y otra con 
30% de níquel. Se probaron las aleaciones en dos tiem- 
pos de carga diferentes, de 25 y 50 días. Se realizó un 
factorial 2* con los factores siguientes: 
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% de ácido sulfúrico: 4%, 6% (x,) 
tiempo de carga: 25 días, 50 días x) 
composición del níquel: 30%, 75%  (x,) 


Se preparó un espécimen para cada una de las 8 con- 
diciones. Como los ingenieros no estaban seguros de 
la naturaleza del modelo, es decir, de si se necesitarían 
о no términos cuadráticos, incorporaron un tercer ni- 
vel (intermedio) y realizaron 4 corridas centrales uti- 
lizando 4 especímenes con ácido sulfúrico al 5%, 37.5 
días y una composición de níquel de 52.5%. A conti- 
nuación se incluyen las resistencias en kilogramos por 
pulgada cuadrada. 


Tiempo de carga 


25 días 50 días 
Composición Ácido sulfúrico Ácido sulfúrico 
del níquel 4% 6% 4% 6% 
75% 52.5 56.5 47.9 47.2 
30% 50.2 50.8 47.4 41.7 


Las corridas centrales produjeron las siguientes resis- 
tencias: 
51.6, 51.4, 52.4, 52.9 


=1,1 


X2 


E 


Capítulo 15 Experimentos factoriales 2* y fracciones 


a) Haga pruebas para determinar cuáles efectos prin- 
cipales e interacciones deberían incluirse en el 
modelo ajustado. 


b) Pruebe para la curvatura cuadrática. 


c) Si la curvatura cuadrática es significativa, ¿cuán- 
tos puntos de diseño adicionales se necesitan para 
determinar cuáles términos cuadráticos deberían 
incluirse en el modelo? 


15.16 Suponga que es posible llevar a cabo una ré- 
plica del experimento del ejercicio 15.13. 


a) ¿Una segunda réplica del esquema de bloques del 
ejercicio 15.13 sería la mejor opción? 

b) Si la respuesta del inciso a es negativa, propor- 
cione el diseño de una mejor opción para la se- 
gunda réplica. 


с) ¿Qué concepto utilizó en la elección del diseño? 


15.17 Considere la figura 15.14, que representa un 
factorial 2? con 3 corridas centrales. Si la curvatura 
cuadrática es significativa, ¿cuáles otros puntos de di- 
seño seleccionaría, que permitieran estimar los térmi- 
nos х? y x3? Explique su respuesta. 


1,1 


1, -1 
X] 


Figura 15.14: Gráfica para el ejercicio 15.17. 


15.6 Experimentos factoriales fraccionarios 


El experimento factorial 2* se puede volver muy demandante, en términos del número de 
unidades experimentales requeridas, cuando el valor de k es grande. Una de las ventajas 
reales de este plan experimental es que permite un grado de libertad para cada interac- 
ción. Sin embargo, en muchas situaciones experimentales se sabe que ciertas interaccio- 
nes son despreciables, por lo que sería un desperdicio de esfuerzo experimental utilizar 
el experimento factorial completo. De hecho, el experimentador podría tener limitacio- 
nes económicas que le impidan hacer observaciones de todas las combinaciones 2* de 
tratamientos. Cuando k es grande, a menudo se puede usar un experimento factorial 
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fraccionario donde quizás sea posible llevar a cabo la mitad, un cuarto o incluso un 
octavo del plan factorial total. 


Construcción de la fracción de 5 


La construcción del diseño de media réplica es idéntica a la asignación del experimento 
factorial 2* en dos bloques. Se comienza por seleccionar un contraste de definición que 
se sacrificará por completo. Luego se construyen los dos bloques en concordancia y se 
elige cualquiera de ellos como plan experimental. 

A menudo la fracción de 5 de un factorial 2% se conoce como diseño 2*”*, el cual 
indica el número de puntos de diseño. El primer ejemplo de un diseño 2%! será uno de 
1 o uno de 2? o uno de 2? -!. En otras palabras, el científico о el ingeniero no puede usar 
el complemento completo, es decir, todo el diseño 2° con 8 puntos de diseño, por lo que 
debe apelar a un diseño con sólo cuatro puntos de diseño. La pregunta es la siguiente: de 
los puntos de diseño (1), a, b, ab, ac, c, bc y abc, ¿cuáles son los cuatro puntos de diseño 
que producirán el diseño más útil? La respuesta, junto con los conceptos importantes re- 
lacionados, aparece en la tabla de signos + y — que muestra los contrastes para el diseño 
2* completo. Considere la tabla 15.9. 


Tabla 15.9: Contrastes para los siete efectos disponibles en el caso de un experimento factorial 25 


Combinación Efectos 
de tratamientos I A В С АВ АС ВС АВС 

gal a + н = = Ф + 
b += += = + >- + 

c += = + + - >- + 

abc + + + + + F F + 

де аЬ ++ +- + -= - z 
ac + E. = + = + = = 

bc + = + + = = + = 

0) t = = = + + + - 


Observe que las dos fracciones - son fa, b, c, abc) y Lab, ac, bc, (1)). Observe tam- 
bién en la tabla 15.9 que en ambos diseños ABC no tiene contraste, pero todos los demás 
efectos sí lo tienen. En una de las fracciones se tiene que ABC contiene todos los signos 
+ y en la otra fracción el efecto ABC contiene todos los signos —. Como resultado, se 
dice que el diseño de la parte superior de la tabla es descrito por ABC = 1, y el de la 
parte inferior por ABC = —I. La interacción ABC se denomina generador del diseño, y 
АВС = 1(о ABC = —I para el segundo diseño) recibe el nombre de relación definitoria. 


Alias en el 25-1! 


Si nos centramos en el diseño ABC = І (el 2%* superior), es evidente que seis efectos 
contienen contrastes. Esto produce la apariencia inicial de que todos los efectos se pue- 
den estudiar por separado de ABC. Sin embargo, el lector recordará que con sólo cuatro 
puntos de diseño, incluso si se replican, los grados de libertad disponibles (además del 
error experimental) son 
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Términos del modelo de regresión 3 
Intersección 1 
4 


Un análisis más detallado sugiere que los siete efectos no son ortogonales y que cada 
contraste está representado en otro efecto. De hecho, si se emplea el símbolo = para 
denotar contrastes idénticos, se tiene que 


A=BC; B=AC; C=AB. 


Como resultado, dentro de un par no es posible estimar un efecto independiente de su 
“socio” alias. Los efectos 
a+ abc=b=c a+ abc=b=c 


qa oO BC= 
2 y 2 


producirán el mismo resultado numérico, de manera que contienen la misma informa- 
ción. De hecho, con frecuencia se dice que comparten un grado de libertad. En reali- 
dad, el efecto estimado verdaderamente estima la suma, es decir, A + BC. Se dice que A 
y BC son alias, al igual que B y AC, y que C y AB. 

Para la fracción АВС = —1 se observa que los alias son los mismos que para la frac- 
ción ABC = I, además del signo. Así, se tiene 


A=-—BC; В = —АС, С = —АВ. 


Las dos fracciones aparecen en las esquinas de los cubos de las figuras 15.15а y 


15.15b. 
Pa Е К. ИШЕ 
С ас 
С C 
A a 2 АШИР 
А А 
(a) La fracción ABC = I (a) La fracción ABC = —/ 


Figura 15.15: Las fracciones 1 del factorial 2°. 


Cómo se determinan los alias en general 


En general, para un diseño 2*7!, cada efecto, además de aquel definido por el generador, 
tendrá un solo socio alias. El efecto definido por el generador no tendrá alias en otro 
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efecto, sino que su alias será la media, ya que el estimador de mínimos cuadrados será 
la media. Para determinar el alias de cada efecto, sólo se comienza con la relación defi- 
nitoria, digamos ABC = І, para el diseño 2*!, Entonces, para obtener, digamos, el alias 
para el efecto A, se multiplica A por ambos lados de la ecuación ABC = I y se reduce 
cualquier exponente por el módulo 2. Por ejemplo, 


A-ABC=A, con loque BC=A. 


En forma similar, 


B = В. АВС = АВ?С = АС, 


y, por supuesto, 


С = С. АВС = ABC = АВ. 


Ahora, рага la segunda fracción, es decir, la definida por la relación АВС = —1[, 


А = —ВС, В = —АС; С = —АВ. 


Como resultado, el valor numérico del efecto А en realidad estima A — BC. De manera 
similar, el valor de В estima В — AC, y el valor de С estima С — AB. 


Construcción formal del diseño 2%! 


La comprensión plena del concepto de los alias facilita el conocimiento de la construc- 
ción del diseño 2^=!. Se comienza con la investigación del 2°—!. Se requieren tres factores 
y cuatro puntos de diseño. El procedimiento comienza con un factorial completo en 
k— 1 = 2 factores A у B. Después se agrega un tercer factor de acuerdo con las estructuras 
de alias deseadas. Por ejemplo, con ABC como el generador, resulta claro que С = +AB. 
Así, se descubre que С = АВ, о С = —AB complementan el factorial completo en A у В. 
La tabla 15.10 ilustra un procedimiento que resulta muy sencillo. 


Tabla 15.10: Construcción de los dos diseños 237! 


2? básico 25-1; АВС =I 25-1; АВС = —1 
А B А В С=АВ А В С=-АВ 
= = == = + = == == 

+ — + — — + — + 

= + – + — — + + 

+ + + + + + + — 


Note que ya vimos que АВС = I proporciona los puntos de diseño a, b, c y abc; en 
tanto que ABC = —I proporciona (1), ас, bc y ab. Anteriormente pudimos construir los 
mismos diseños usando los contrastes que se muestran en la tabla 15.9. Sin embargo, a 
medida que el diseño se vuelve más complicado con fracciones superiores, esas tablas 
de contrastes se vuelven más difíciles de trabajar. 

Ahora considere un diseño 2*!, es decir, > de un diseño factorial 2*, que incluye los 
factores A, В, C y D. Como еп el caso del diseño 2?-!, la interacción que se usa como 
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generador es la interacción de mayor orden, en este caso ABCD. Debe recordarse que 
ABCD = 1, la relación definitoria sugiere que se sacrifica la información sobre ABCD. 
Aquí comenzamos con el diseño 2* completo en A, B y C, y se forma D = +ABC para 
generar los dos diseños 2?-'!. La tabla 15.11 ilustra la construcción de ambos diseños. 


Tabla 15.11: Construcción de los dos diseños 24! 


23 Básico 24-1; ABCD =I 24-1; ABCD = —I 
А В C A B C D=ABC A В С  D=-ABC 
== - - =- - - == - + 
+ = - + = - + + = - - 
- + =- - + - + - + - - 
+ + —- + + —- - + + -= + 
- — + == + + - — + - 
+ - + + - + - + — + + 
= + + = + + - = + + + 
+ + + + + + + + + + - 


Aquí, empleando las notaciones a, b, c, etcétera, se tienen los diseños siguientes: 


ABCD = 1, (1), ad, bd, ab, cd, ac, bc, abcd 

ABCD = –1, d, a, b, abd, c, acd, bcd, abc. 
En el caso de 2**, los alias se obtienen como se describió antes para 2%*, Cada 
efecto tiene un solo socio alias que se obtiene mediante la multiplicación que se efectúa 


utilizando la relación definitoria. Por ejemplo, el alias de A para el diseño ABCD = I es 
dado por 


А = А · ABCD = А?ВСР = BCD. 
El alias рага АВ es dado рог 


АВ = АВ · ABCD = А?В?СР” = CD. 


Como es fácil observar, los efectos principales tienen alias con interacciones de tres fac- 
tores y las interacciones de dos factores tienen alias con otras interacciones de dos facto- 
res. La lista completa es dada por 


A=BCD АВ = СР 
В = АСР AC= BD 
C = ABD AD = BC 
D = ABC. 


Construcción de la fracción de 1 


En el caso de la fracción de І, en vez de una se seleccionan dos interacciones рага 
ser sacrificadas, y la tercera resulta al obtener la interacción generalizada de las dos 
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seleccionadas. Observe que esto se asemeja mucho a la construcción de cuatro bloques. 
La fracción que se emplea es simplemente uno de los bloques. Un ejemplo sencillo 
ayuda mucho a ver la conexión con la construcción de la fracción de І. Considere la 
construcción de + de un factorial 25, es decir, un diseño 2%? con los factores А, B, С, D 
y E. Un procedimiento que evita el confundir dos efectos principales es la selección 
de ABD y ACE como las interacciones que corresponden a los dos generadores, lo que 
produce ABD = I y ACE = 1 como las relaciones definitorias. La tercera interacción 
sacrificada sería (АВР)(АСЕ) = A?BCDE = BCDE. Para la construcción del diseño se 
comienza con un factorial 257? = 2? en A, В y С. Se usan las interacciones ABD y ACE 
para proporcionar los generadores, de manera que el factorial 2° en A, В y C es propor- 
cionado рог el factor Р = + АВ y E = ҒАС. Así, una de las fracciones es dada por 


A B C D=AB E=AC 
= = = + + de 
+ = = = — a 
— + = — + be 
+ + = + — abd 
— — + + — са 
SE = + = Е асе 
— + + — — bc 
+ + + + + abcde 
Las otras tres fracciones se calculan utilizando los generadores {D = —AB, E = AC}, 


{D = AB, E = —AC} y {D = —AB, E = —AC}. Considere un análisis del diseño 2%? 
anterior, que contiene ocho puntos de diseño para estudiar cinco factores. Los alias para 
los efectos principales son dados por 


A(ABD) = BD A(ACE) = CE A(BCDE) = ABCDE 
B =AD = ABCE = CDE 
C = ABCD = АЕ = BDE 
D = АВ = ACDE = ВСЕ 
Е = АВрЕ = АС = BCD 


Los alias para otros efectos se pueden obtener de la misma manera. El desglose de los 
grados de libertad es dado por (además de la réplica) 


Efectos principales 5 
Falta de ajuste 2 (СР = ВЕ, ВС = РЕ) 
Total 7 


Se listan las interacciones sólo para el grado dos en la falta de ajuste. 

Ahora considere el caso de un diseño 28°, que permite 16 puntos de diseño para 
estudiar seis factores. Nuevamente se eligen dos generadores de diseño. Una opción 
pragmática para complementar un factorial 28? = 2* completo en A, B, С y D consiste 
en usar E = +ABC y F = +ВСР. La construcción se muestra en la tabla 15.12. 

Es evidente que con ocho puntos de diseño más que en 2%? los alias de los efectos 
principales no representarán un problema difícil. De hecho, observe que con las rela- 
ciones definitorias ABCE = +1, BCDF = + І, y (АВСЕ)(ВСРЕ) = ADEF = +1, los 
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Tabla 15.12: Diseño 267? 


Combinación 
A B C D Е=АВС F=BCD de tratamientos 
- = =- >- - - (0 
+ – – – + - ae 
= + = = + + bef 
+ + = = = + abf 
— — + = + + cef 
+ — + = = + acf 
— + + — — = bc 
+ + + = + = abce 
«= - = + — + df 
+ = = + + + adef 
- + Е + + — bde 
+ + - + - - abd 
— - + + + = сае 
+ = + + = = аса 
= + + + == + bcdf 
+ + + + + + abcdef 


efectos principales tendrán alias con interacciones que no son menos complejas que las 
de tercer orden. La estructura de los alias para los efectos principales se escribe 

A = BCE = ABCDF = DEF, D = ABCDE = ВСЕ = AFF, 

B = ACE = CDF = ABDEF, E = ABC = BCDEF = ADF, 

C = ABE = BDF = ACDEF, F = ABCEF = BCD = ADE, 


cada uno con un solo grado de libertad. Para las interacciones de dos factores, 


AB = CE = ACDF = BDEF, AF = BCEF = ABCD = DE, 
AC = BE = ABDF = CDEF, BD = ACDE = CF = ABFF, 
AD = BCDE = ABCF = FF, BF = ACEF = CD = ABDE, 
AE = BC = ABCDEF = DF. 


Por supuesto, aquí hay algunos alias entre las interacciones de dos factores. Los dos 
grados de libertad restantes se explican por medio de los siguientes grupos: 


ABD = CDE = ACF = BEF, ACD = BDE = ABF = CEF. 


Es evidente que antes de recomendar finalmente el plan experimental siempre debe- 
mos estar conscientes de que la estructura de alias es para un experimento fraccionario. 
La selección adecuada de contrastes de definición es importante, ya que es lo que deter- 
mina la estructura de los alias. 


15.7 Análisis de experimentos factoriales fraccionados 


La dificultad para realizar pruebas formales de significancia con datos de experimen- 
tos factoriales fraccionados radica en la determinación del término del error apropiado. 
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A menos que se disponga de datos de experimentos anteriores, el error debe provenir de 
una agrupación de contrastes que representan efectos que se presume son despreciables. 

Las sumas de cuadrados para los efectos individuales se calculan usando en esencia 
los mismos procedimientos que se emplean para obtener el factorial completo. Es posi- 
ble formar un contraste en las combinaciones de tratamientos construyendo la tabla de 
signos positivos y negativos. Por ejemplo, para media réplica de un experimento facto- 
rial 2° соп ABC como contraste de definición, un conjunto posible de combinaciones de 
tratamientos, junto con el signo algebraico apropiado para cada contraste que se usa para 
calcular los efectos y las sumas de cuadrados de los distintos efectos, sería como el que 
se presenta en la tabla 15.13. 


Tabla 15.13: Signos рага los contrastes en media réplica de un experimento factorial 2* 


Combinación Efecto factorial 
de tratamientos A B C AB AC ВС АВС 
a + = = o -= o - + + 
b = + = == + - + 
c - =- + + -= >- + 
abc + + + + + T T 


Observe que en la tabla 15.13 los contrastes A y BC son idénticos, lo cual ilustra los 
alias. Asimismo, B = AC y C = AB. En esta situación se tienen tres contrastes ortogo- 
nales que representan los 3 grados de libertad disponibles. Si se obtuvieran dos observa- 
ciones para cada una de las cuatro combinaciones de tratamientos, entonces tendríamos 
un estimado de la varianza del error con 4 grados de libertad. Si suponemos que los efec- 
tos de interacción son despreciables, podríamos probar la significancia de todos los efectos 
principales. 

Un ejemplo del efecto y la suma de cuadrados correspondientes es 


-h р 2 
д= Ь а sca- (9 b=c+abc) | 
2п 22n 


En general, la suma de cuadrados con un grado de libertad para cualquier efecto en 
una fracción 2™ de un experimento factorial 2* (p < k) se obtiene elevando al cuadrado 
los contrastes en los totales de los tratamientos seleccionados y dividiendo entre 2'-?n, 
donde n es el número de réplicas de estas combinaciones de tratamientos. 


Ejemplo 15.6: | Suponga que se desea emplear una media réplica para estudiar los efectos de cinco fac- 
tores, cada uno en dos niveles, sobre alguna respuesta, y que se conoce que cualquiera 
que sea el efecto de cada factor, será constante para cada nivel de los demás factores. En 
otras palabras, no hay interacciones. Sea el contraste de definición ABCDE lo que oca- 
siona que los efectos principales tengan alias con interacciones de cuatro factores. El 
agrupamiento de contrastes que incluyen interacciones proporciona 15 — 5 = 10 grados 
de libertad para el error. Realice un análisis de varianza con los datos de la tabla 15.14 y 
pruebe todos los efectos principales a un nivel de significancia de 0.05. 

Solución: Las sumas de cuadrados y los efectos para los efectos principales son 


(11.3 — 15.6 — ·:: — 14.7 +13.2} _ (-17.5)? 


A= 
J Dan 16 


= 19.14, 
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Tabla 15.14: Datos para el ejemplo 15.6 


Tratamiento Respuesta | Tratamiento Respuesta 
a 11.3 bcd 14.1 
b 15.6 abe 14.2 
С 12.7 асе 11.7 
а 10.4 аде 9.4 
е 9.2 bce 16.2 
abc 11.0 bde 13.9 
abd 8.9 cde 14.7 
acd 9.6 abcde 13.2 

A =—1%9 = -2.19, 
(—11.3 + 15.6 —---— 14.7 + 13.2)? (18.1)? 
SCB = е] == 20.48, 


В = #1 = 2.26, 


(11.3 – 15.6+::: + 14.7 + 13.2)2 _ (10.3)? _ 


5СС = 55-1 T 6.63, 
C= 193 = 1.21, 
_(—11.3-15.6-:::+ 14.7 + 13.2)2 _ (-7.7)2 _ 
SCD = 55-1 aie “УЬ 
D = 212 = —0.96, 
_ (—11.3 – 15.6 — ::- + 14.7 + 13.2)? _ (8.9)? _ 
SCE = 55-1 == 495 
Е = 2 = 1.11. 


Todos los demás cálculos y pruebas de significancia se resumen en la tabla 15.15. Las 
pruebas indican que el factor A tiene un efecto negativo significativo sobre la respuesta; 
mientras que el factor В tiene un efecto positivo significativo. Los factores С, D y E no 
son significativos al nivel de significancia de 0.05. 


Ejercicios 


15.18 Liste los alias de los diferentes efectos en un 
experimento factorial 2% cuando el contraste de defini- 
ción es ACDE. 


15.19 а) Obtenga una fracción de > de un diseño fac- 
torial 2* usando BCD como el contraste de definición. 
b) Divida la fracción de + en dos bloques de cuatro 
unidades cada uno confundiendo ABC. 


c) Construya la tabla de análisis de varianza (fuentes 
de variación y grados de libertad) para probar to- 
dos los efectos principales no confundidos, si se 
acepta que todas las interacciones de los efectos 
son despreciables. 


15.20 Construya una fracción de $ de un diseño fac- 
torial 2° utilizando ABCD y BDEF como los contrastes 
de definición. Diga cuáles efectos tienen alias con los 
seis efectos principales. 


Ejercicios 
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Tabla 15.15: Análisis de varianza para los datos de media réplica de un experimento 


factorial 25 


Fuente de Suma de Grados de Cuadrado f 
variación cuadrados libertad medio calculada 
Efecto principal: 
A 19.14 1 19.14 6.21 
B 20.48 1 20.48 6.65 
C 6.63 1 6.63 2.15 
D 3.71 1 3.71 1.20 
Е 4.95 1 4.95 1.61 
Error 30.83 10 3.08 
Total 85.74 15 
15.21 a) Con los contrastes de definición ABCE y A B C D Respuesta 
ABDF obtenga una fracción de A de un diseño 26. -1 =1 -1 =1 6.6 
Б) Muestre la tabla del análisis de varianza (fuentes 1 —1 —1 1 6.9 
de variación y grados de libertad) para todas las = 1 =l 1 7.9 
pruebas apropiadas, suponiendo que E y F no in- 1 1 -1 =l 6.1 
teractúan y que las interacciones de tres factores y -1 -1 1 1 9.2 
mayores son despreciables. 1 -1 1 -1 6.8 
=1 1 1 —1 10.4 
15.22 Еп un experimento que implica sólo 16 ensa- 1 1 1 1 7.3 


yos se varían siete factores en dos niveles. Se utiliza un 
experimento factorial 2? con una fracción de E, con los 
contrastes de definición ACD, BEF y CEG. Los datos 
son los siguientes: 


Combinación Combinación 
de tratamientos Respuesta | de tratamientos Respuesta 
(1) 31.6 асе 31.1 
ad 28.7 cdg 32.0 
abce 33.1 beg 32.8 
cdef 33.6 adefg 35.3 
acef 33.7 efg 32.4 
Ьсае 34.2 abdeg 33.3 
abdf 32.5 bcdfg 35.6 
bf 27.8 abcfg 35.1 


Realice un análisis de varianza sobre los siete efectos 
principales, suponiendo que las interacciones son des- 
preciables. Use un nivel de significancia de 0.05. 


15.23 Se lleva a cabo un experimento рага que un in- 
geniero adquiera conocimiento acerca de cómo influye 
la temperatura de sellado A, la temperatura de enfria- 
miento de una barra B, el porcentaje de aditivo de polie- 
tileno C y la presión D sobre la resistencia del sello (en 
gramos por pulgada) de un lote de envoltura para pan. 
Se utiliza un experimento factorial 2* con fracción de + 
con un contraste de definición ABCD. A continuación 
se presentan los datos. Realice un análisis de varianza 
sólo sobre los efectos principales usando а = 0.05 


15.24 En un experimento realizado en el Departa- 
mento de Ingeniería Mecánica, y analizado por el Centro 
de Consultoría en Estadística de Virginia Tech, un sen- 
sor detecta una carga eléctrica cada vez que las aspas de 
una turbina completan un giro. Luego, el sensor mide la 
amplitud de la corriente eléctrica. Seis factores son rpm 
A, temperatura B, distancia entre las aspas C, distancia 
entre las aspas y la carcasa D, ubicación de la entrada 
E, y ubicación del detector F. Se utiliza un experimento 
factorial 2° con fracción de Г, con contrastes de defini- 
ción ABCE y BCDF. Los datos son los siguientes: 


A в C D E F Respuesta 
—1 -1 -1 —1 —1 —1 3.89 
1 -1 —1 —1 1 —1 10.46 
—1 1 —1 —1 1 1 25.98 
1 1 -1 -—1 —1 1 39.88 
=1 —1 1 -—1 1 1 61.88 
1 —1 1 —1 —1 1 3.22 
—1 1 1 -1 —1 -—1 8.94 
1 1 1 —1 1 —1 20.29 
—1 —1 —1 1 —1 1 32.07 
1 —1 —1 1 1 1 50.76 
—1 1 —1 1 1 —1 2.80 
1 1 —1 1 —1 —1 8.15 
=1 —1 1 1 1 —1 16.80 
1 —1 1 1 —1 —1 25.47 
—1 1 1 1 —1 1 44.44 
1 1 1 1 Í 1 2.45 
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Realice un análisis de varianza de los efectos principa- 
les y las interacciones de dos factores, si se acepta que 
las interacciones de tres factores o más son desprecia- 
bles. Use а = 0.05. 


15.25 En el estudio denominado Durability of Rubber 
to Steel Adhesively Bonded Joints, efectuado por el 
Departamento de Ciencias del Ambiente y Mecánica, 
y analizado por el Centro de Consultoría en Estadística 
de Virginia Tech, un experimentador midió el número 
de roturas en un sello adhesivo. Se planteó que la con- 
centración de agua marina A, la temperatura B, el pH C, 
el voltaje D y la tensión E influyen en el rompimiento 
de un sello adhesivo. Se utilizó un experimento facto- 
rial 25 con fracción de + y соп el contraste de definición 
ABCDE. Los datos son los siguientes: 


A B C D E Respuesta 


= =] =] =l 1 462 
1—1 —1 -1 -l 746 
=l 1 -1 -1 —1 714 
1 1 -1 -1 1 1070 
-1 -1 I =I =1 474 
1) =] 1—1 1 832 
=1 1 1—1 1 764 
1 1 1 =] -=l 1087 
=1 =l = 1 —1 522 
1 =l =l | 1 854 
=1 1 =l 1 1 773 
1 L з=] 1 —1 1068 
=| =l 1 1 1 572 
1 1 1 1 =l 831 
=l 1 1 1 —1 819 
1 1 1 1 1 1104 


Realice un análisis de varianza de los efectos princi- 
pales y de las interacciones de dos factores AD, AE, 
BD, ВЕ, suponga que las interacciones de tres o más 
factores son despreciables. Use œ = 0.05. 


15.26 Considere un diseño 257! con los factores А, 
В, С, Р y E. Construya el diseño comenzando con un 
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diseño 2* y use E = ABCD como generador. Indique 
todos los alias. 


15.27 Hay seis factores y sólo se pueden usar ocho 
puntos de diseño. Construya un diseño 28°, comen- 
zando con un diseño 2*, y utilice D = AB, E = —AC y 
F = BC como generadores. 


15.28 Considere el ejercicio 15.27. Construya otro 
25-3 que sea diferente del diseño elegido en el ejercicio 
15.27. 


15.29 Para el ejercicio 15.27 proporcione todos los 
alias para los seis efectos principales. 


15.30 En Myers, Montgomery y Anderson-Cook 
(2009) se analiza una aplicación en la cual a un inge- 
niero le interesan los efectos del agrietamiento de una 
aleación de titanio. Los tres factores son A, tempera- 
tura; B, contenido de titanio; y C, cantidad de refinador 
en grano. La siguiente tabla presenta una parte del di- 
seño y la respuesta, la longitud de las grietas inducida 
en la muestra de la aleación. 


A B C Respuesta 
—1 —1 —1 0.5269 

1 1 —1 2.3380 

1 —1 1 4.0060 

1 1 1 3.3640 


a) ¿Cuál es la relación de definición? 

b) Proporcione alias para los tres efectos principales 
asumiendo que las interacciones de dos factores 
pueden ser reales. 

c) Si suponemos que las interacciones son desprecia- 
bles, ¿cuál será el factor principal más importante? 

d) ¿Qué nivel sugeriría para el factor obtenido en el 
inciso c en la producción final, alto o bajo? 

e) ¿Qué niveles sugeriría para los demás factores en 
la producción final? 

f) ¿Qué riesgos hay en las recomendaciones que hizo 
en los incisos d y e? Responda de manera deta- 
llada. 


15.8 Diseños de fracciones superiores y de filtrado 


Algunas situaciones industriales requieren que el analista determine cuáles factores con- 
trolables, de entre un número grande de ellos, tienen un efecto sobre alguna respuesta 
importante. Los factores pueden ser cualitativos o variables de clase, variables de regre- 
sión o una mezcla de ambas. El procedimiento analítico puede requerir un análisis de va- 
rianza, una regresión o ambos. A menudo el modelo de regresión utilizado sólo incluye 
los efectos lineales principales, aunque tal vez sea posible estimar algunas interacciones. 
La situación exige la selección de variables y los diseños experimentales resultantes se 
denominan diseños de filtrado. Es evidente que los diseños ortogonales de dos niveles 
saturados o casi saturados son candidatos viables. 


15.9 Construcción de diseños de resolución III y IV, con 8, 16 y 32 puntos de diseño 637 


Resolución del diseño 


Definición 15.1: 


A menudo los diseños ortogonales de dos niveles se clasifican según su resolución, la 
cual es determinada por la siguiente definición. 


La resolución de un diseño ortogonal de dos niveles es la longitud de la interacción más 
pequeña (menos compleja) de entre el conjunto de contrastes de definición. 


Si el diseño se construye como un factorial completo o fraccionado, ya sea un di- 
seño 2“, o bien, 2, р = 1, 2,..., k — 1, el concepto de resolución del diseño es un auxi- 
liar para determinar el efecto de los alias. Por ejemplo, un diseño de resolución II sería 
de poca utilidad, ya que habría al menos un caso de alias de un efecto principal con otro. 
Un diseño de resolución III tendría todos sus efectos principales (lineales) ortogonales 
entre sí. No obstante, habrá algunos alias entre los efectos lineales y las interacciones de 
dos factores. Entonces, es evidente que si el analista está interesado en estudiar los efectos 
principales (lineales en el caso de la regresión) y no hay interacciones de dos factores, 
entonces se requiere un diseño cuya resolución sea de al menos III. 


15.9 Construcción de diseños de resolución Ш y IV, 


con 8, 


16 y 32 puntos de diseño 


Es posible construir diseños útiles con resoluciones Ш y IV para 2 a 7 variables con 
8 puntos de diseño. Empezamos con un factorial 2° que haya sido saturado simbólica- 
mente con interacciones. 


X1 X2 X3 X1 X2 X1 Хз X2 Хз X1 Хә X3 
—1 —1 -1 1 1 1 —1 

1 =1 dl -1 -1 1 1 
-1 1 —1 ке! 1 -1 1 
= 1. =í 1 1 =1 -1 1 

1 1 -1 1 =l -1 —1 

1 =í 1 -1 1 —1 —1 
-1 1 1 =1 —1 1 =1 

1 1 1 1 1 1 1 


Es evidente que, con sólo reemplazar las columnas de interacción por nuevos efec- 
tos principales para las siete variables, se puede construir un diseño de resolución Ш. 
Por ejemplo, podríamos definir 


X, = XX, (contraste de definición ABD) 
X, = ХХ, (contraste de definición ACE) 
х= хх, (contraste de definición ВСЕ) 
X, = XXX, (contraste de definición ABCG) 


y obtendríamos una fracción 27* de un factorial 2”. Las expresiones anteriores identifican 
los contrastes de definición elegidos. Resultan once contrastes de definición adicionales 
y todos contienen al menos tres letras. Así, el diseño es de resolución Ш. Es evidente que 
51 se comienza con un subconjunto de columnas aumentadas y se concluye con un diseño 
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Tabla 15.16: Algunos diseños 217” de resoluciones Ш, IV, V, VI y VII 


Número de Número de 
factores Diseño puntos Generadores 

3 а. 4 С=+АВ 

4 lv 8 D = +АВС 

5 Di 8 Р = +АВ; E = +АС 

6 297! 32 Е = +АВСрЕ 
Dy 16 E =+ABC; F = +BCD 
21° 8 D = +АВ; Е = +ВС; Е = +АС 

7 2р 64 С = +АВСРЕЕ 
y- 32 Е =+АВС; G = +АВрЕ 
2 16 Е = +АВС ; Е = +ВСр; С = +АСр 
2" 8 D = +АВ; E = +АС; F = +ВС; С = +АВС 

8 > 64 G=+tABCD; Н =+ABEF 
2р 32 Е = +АВС ; С = +АВр ; Н = +BCDE 


que incluye menos de 7 variables de diseño, el resultado es un diseño de resolución Ш 
en menos de siete variables. 

Es posible construir un conjunto similar de diseños posibles para 16 puntos de di- 
seño, comenzando con un diseño 2* saturado con interacciones. Las definiciones de las 
variables que corresponden a estas interacciones producen diseños de resolución Ш por 
medio de 15 variables. De manera similar, se pueden construir diseños que contengan 32 
corridas, comenzando con un diseño 25. 

La tabla 15.16 proporciona lineamientos para construir diseños de 8, 16, 32 y 64 
puntos, con resolución Ш, IV e incluso V. La tabla proporciona el número de factores, 
el número de corridas y los generadores que se utilizan para producir los diseños 2%. 
El generador dado se emplea para aumentar el factorial completo que contiene k — p 
factores. 


15.10 Otros diseños de resolución ПІ de dos niveles; 
los diseños de Plackett-Burman 


Una familia de diseños desarrollada por Plackett y Burman (1946, véase la bibliografía) 
llena el vacío del tamaño de la muestra que existe con los factoriales fraccionados. Éstos 
son útiles con muestras de tamaño 27, es decir, incluyen muestras de tamaños 4, 8, 16, 
32, 64,... Los diseños de Plackett -Burman incluyen 4r puntos de diseño, por lo que se 
dispone de diseños de tamaño 12, 20, 24, 28, etcétera. Estos diseños de Plackett-Burman 
de dos niveles son diseños de resolución Ш y son muy fáciles de construir. Se propor- 
cionan “renglones básicos” para cada tamaño de muestra. Estos renglones de signos + y 
— son п — 1 en número. Para construir las columnas de la matriz de diseño se comienza 
con el renglón básico y se hace una permutación cíclica sobre las columnas, hasta que 
se forman k columnas (el número deseado de variables). Después se llena el último 
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renglón con signos negativos. El resultado será un diseño de resolución Ш con К variables 
(К = 1, 2,..., N). Los renglones básicos son los siguientes: 


N=12. ++ - ++ +---+- 

N=l6 +++ +4-+-+4+--+--- 

N=20 + += -++++-+-+----4+- 

N=M + +++ +- + -+ + —--+ + -- + - + —-—- —-—- 


Ejemplo 15.7 | Construya un diseño depurado de dos niveles con 6 variables que contengan 12 puntos 
de diseño. 

Solución: Comience con el renglón básico en la columna inicial. La segunda columna se forma 
llevando la entrada inferior de la primera columna a la parte superior de la segunda, y 
repitiendo la primera. La tercera columna se forma del mismo modo, utilizando las entra- 
das de la segunda columna. Cuando haya un número suficiente de columnas sencillamen- 
te se llena el último renglón con signos negativos. El diseño resultante es como sigue: 


X2 X4 X5 X6 


X1 X3 

+ - + - - - | 
+ + - + - - 
- + + - + - 
+ - + + - + 
+ + — + + - 
+ + + - + + 
- + + + - + 
- - + + + = 
- - - + + + 
+ - -= - + + 
- + — - - + 


Los diseños de Plackett-Burman son populares en la industria para situaciones de 
filtrado. Como se trata de diseños de resolución III. todos los efectos lineales son orto- 
gonales. Para cualquier tamaño de muestra el usuario dispone de un diseño para k = 2, 
3,..., N — 1 variables. 

La estructura de alias para el diseño de Plackett-Burman es muy complicada, por 
lo que el usuario no puede construir el diseño con un control completo de la estructura 
de alias, como en el caso de los diseños 2* o 2%, Sin embargo, en el caso de modelos de 
regresión el diseño de Plackett-Burman acepta interacciones (aunque no serán ortogona- 
les) cuando se dispone de suficientes grados de libertad. 2 


15.11 Introducción а la metodología de superficie de respuesta 


En el estudio de caso 15.2 se ajustó un modelo de regresión a un conjunto de datos con 
la meta específica de encontrar condiciones en esas variables de diseño que optimizaran 
(maximizaran) la eficiencia de purificación del carbón. El modelo incluía tres efectos 
principales lineales, tres términos de interacción de dos factores y un término de inte- 
racción de tres factores. La respuesta del modelo era la eficiencia de la purificación, y 
las condiciones óptimas de х, x, y x, se obtuvieron utilizando los signos y la magnitud 
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de los coeficientes del modelo. En este ejemplo se utilizó un diseño de dos niveles para 
mejorar el proceso o para optimizarlo. En muchas áreas de la ciencia y de la ingeniería 
la aplicación se extiende para incluir modelos y diseños más complicados a los que, 
en conjunto, se les denomina metodología de superficie de respuesta (MSR). Esta 
metodología abarca tanto métodos gráficos como analíticos. El término superficie de 
respuesta se deriva de la apariencia de la superficie multidimensional de la respuesta 
estimada constante de un modelo de segundo orden, es decir, un modelo con términos de 
primer y segundo orden. А continuación se presenta un ejemplo. 


El modelo de superficie de respuesta de segundo orden 


En muchos ejemplos industriales de optimización de procesos se utiliza un modelo de 
superficie de respuesta de segundo orden. Para el caso de, digamos k = 2 variables de pro- 
ceso o variables de diseño, y una sola respuesta y, el modelo es dado por 


у = В, + Өх, + BA, +8 +1805 +8 XX, + €. 


12 1 


Aquí se tienen k = 2 términos de primer orden, dos términos puros de segundo orden o 
cuadráticos y un término de interacción dado por 6 ,x,x,. Los términos x, y x, se codifi- 
can en la forma conocida de +1. El término e denota al acostumbrado error del modelo. 
En general, para k variables de diseño el modelo contendrá 1 +k + k + (5) términos del 
modelo y, por lo tanto, el diseño experimental debe contener al menos un número similar 
de puntos de diseño. Además, los términos cuadráticos requieren que las variables de 
diseño estén fijas en el diseño con al menos tres niveles. Al diseño resultante se le deno- 
mina diseño de segundo orden. A continuación se presenta un ejemplo. 

El siguiente diseño central compuesto (DCC) y el ejemplo fueron tomados 
de Myers, Montgomery y Anderson-Cook (2009). Quizás la clase más popular de di- 
seños de segundo orden sea la clase de los diseños centrales compuestos. El ejemplo 
que se presenta en la tabla 15.17 se refiere a un proceso químico en el que la tempe- 
ratura de reacción, En y la concentración del reactante, €. , Se muestran en sus niveles 
naturales y también de forma codificada. Cada factor tiene cinco niveles. Además, se 
incluye el orden en que se realizaron las observaciones de x, y x,. La columna de la de- 
recha proporciona los valores de la respuesta y, el porcentaje de conversión del proceso. 
Los primeros cuatro puntos de diseño representan los conocidos puntos factoriales en los 
niveles +1. Los siguientes cuatro puntos se conocen como puntos axiales, los cuales 
van seguidos por las corridas centrales que se explicaron y ejemplificaron antes en este 
capítulo. De esta manera, los cinco niveles de cada uno de los dos factores son —1, +1, 
—1.414, +1.414 y 0. En la figura 15.16 se presenta una imagen clara de la geometría del 
diseño central compuesto para este ejemplo de k = 2. En esta figura se ilustra la fuente 
del término puntos axiales. Estos cuatro puntos se localizan sobre los ejes factoriales, a 
una distancia axial de œ = \/2 = 1.414 a partir del centro del diseño. De hecho, para este 
DCC en particular, los puntos del perímetro, axiales y factoriales, se encuentran todos a 
la distancia y/2 del centro del diseño, y como resultado tenemos ocho puntos equidistan- 
tes sobre un círculo más cuatro réplicas en el centro del diseño. 


Ejemplo 15.8: | Análisis de superficie de respuesta: Un análisis de los datos en el ejemplo de las dos 


variables podría implicar el ajuste de una función de respuesta de segundo orden. La 
superficie de respuesta resultante se puede utilizar de forma analítica o gráfica para de- 
terminar el impacto que tienen x, y x, sobre el porcentaje de conversión del proceso. Los 
coeficientes en la función de respuesta están determinados por medio del método de 
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Tabla 15.17: Diseño central compuesto para el ejemplo 15.8 


Temperatura (°C) Concentración (%) 


Observación Corrida €, £, хү хо у 
1 4 200 15 21 =[ 43 
2 12 250 15 1 —1 78 
3 11 200 25 —1 1 69 
4 5 250 25 1 1 19 
5 6 189.65 20 —1.414 0 48 
6 7 260.35 20 1.414 0 78 
7 1 225 12.93 0 —1.414 65 
8 3 225 27.07 0 1.414 74 
9 8 225 20 0 0 76 

10 10 225 20 0 0 79 
11 9 225 20 0 0 83 
12 2 225 20 0 0 81 
+2 30 
al 25 
5 
8 
2 opẸ 20 
8 
E "9% 200 225 250 75 


€ 1, Temperatura (°С) 


—2 —1 0 +1 +2 
хү 


Figura 15.16: Diseño central compuesto рага el ejemplo 15.8. 


mínimos cuadrados que estudiamos en el capítulo 12 y que ejemplificamos a lo largo de 
este capítulo. El modelo resultante de respuesta de segundo orden es dado en las varia- 
bles codificadas como 


$ = 79.75 + 10.18x, + 4.22х, — 8.501 — 5.2515 — 7.75x,X,, 
mientras que en las variables naturales es dado por 
ӯ = —1080.22 + 7.7671É, + 23.1932€, — 0.013667 — 0.2100€5 — 0.0620€ &. 


Como este ejemplo sólo incluye dos variables de diseño, el método más esclarece- 
dor para determinar la naturaleza de la superficie de respuesta en la región del diseño 
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consiste en utilizar gráficas de dos o tres dimensiones. Sería interesante determinar 
cuáles niveles de temperatura x, y concentración x, producen un estimado deseable del 
porcentaje de conversión $. La función de respuesta estimada anterior se graficó en tres 
dimensiones y la superficie de respuesta resultante se presenta en la figura 15.17. La 
altura de la superficie es ӯ expresada en porcentaje. En esta figura es fácil observar por 
qué se utiliza el término superficie de respuesta. En el caso en que sólo se utilizan dos 
variables de diseño las gráficas bidimensionales de curvas pueden ser útiles. Observe en 
la figura 15.18 que las curvas de la conversión constante estimada se ven como rodajas 
de la superficie de respuesta. Observe que cualquiera de las dos figuras indica con faci- 
lidad cuáles coordenadas de temperatura y concentración producen el mayor porcentaje 
de conversión estimado. En las gráficas las coordenadas se presentan tanto en unidades 
codificadas como en unidades naturales. Observe que la mayor conversión estimada 
se encuentra en aproximadamente 240°С y una concentración de 20%. La respuesta 
máxima estimada (o pronosticada) en esa ubicación es 82.47%. 


82.47 


38.43 


Concentración 


} 
—1.414 


Figura 15.17: Gráfica de la superficie de respuesta de la conversión pronosticada 
para el ejemplo 15.8. 


Otros comentarios acerca del análisis de superficie de respuesta 


El libro de Myers, Montgomery y Anderson-Cook (2009) proporciona una gran cantidad 
de información sobre el análisis y el diseño de la metodología de superficie de respuesta. 
La ilustración gráfica que se utilizó aquí podría ampliarse con resultados analíticos que 
brindan información acerca de la naturaleza de la superficie de respuesta dentro de la 
región del diseño. 
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Figura 15.18: Gráfica de curvas de la conversión pronosticada para el ejemplo 15.8. 


Se pueden usar otros cálculos para determinar si la ubicación de las condiciones óptimas 
está dentro o muy lejos de la región del diseño experimental. Existen muchos aspectos im- 
portantes a tomar en cuenta cuando se necesita determinar las condiciones apropiadas para 
la operación futura de un proceso. 

Otras secciones del libro de Myers, Montgomery y Anderson-Cook (2009) abordan 
otros aspectos del diseño experimental. Por ejemplo, el diseño central compuesto, aun- 
que es el tipo de diseño más útil, no es el único que se utiliza en la metodología de su- 
perficie de respuesta. En el libro mencionado se analizan muchos otros tipos. Además, el 
diseño central compuesto al que aquí nos referimos es un caso especial en el que k = 2. 
El caso más general k > 2 se analiza en Myers, Montgomery y Anderson-Cook (2009). 
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En este capítulo se destacó el concepto del uso del diseño de experimentos (DE) para 
adquirir conocimientos sobre procesos de ingeniería y científicos. En el caso en que un 
proceso incluye un producto es posible usar el DE para mejorar el producto o la calidad. 
Como se expuso en el capítulo 1, se ha dado mucha importancia al empleo de métodos 
estadísticos para mejorar los productos. Un aspecto importante de este esfuerzo por me- 
jorar la calidad, que surgió en la década de 1980 y continuó a lo largo de la década de 
1990, consiste en incluir la calidad en los procesos y productos en la etapa de investi- 
gación o de diseño del proceso. A menudo se requiere del DE para desarrollar procesos 
con las siguientes propiedades: 


1. Insensibles (robustos) a las condiciones ambientales 
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Variables de 


Definición 15.2: 
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2. Insensibles (robustos) a factores que dificultan el control 


3. Que proporcionen la mínima variación de desempeño 


Los métodos que se utilizan para lograr las características deseables en los puntos 1, 2 
y 3 forman parte de lo que se conoce como diseño robusto de parámetros о DRP (véase 
Taguchi, 1991; Taguchi y Wu, 1985; y Kackar, 1985, en la bibliografía). En este contexto 
el término diseño se refiere al diseño de los procesos o sistemas, en tanto que parámetro 
se refiere a los parámetros en el sistema. Éstos son a los que nos hemos referido como 
factores o variables. 

Queda muy claro que las metas 1, 2 y 3 mencionadas son muy nobles. Por ejemplo, 
un ingeniero petrolero puede tener una buena mezcla de gasolina que se desempeñe muy 
bien en condiciones ideales y estables. Sin embargo, el desempeño se deteriorará debido 
a cambios en las condiciones ambientales, como tipo de conductor, factores climáticos, 
tipo de motor, etc. Un científico de una empresa de alimentos podría tener una muy buena 
mezcla para pasteles, a menos que el usuario no siga con exactitud las instrucciones del 
empaque con respecto a la temperatura del horno, tiempo de horneado, entre otros. Un 
producto o proceso cuyo desempeño sea consistente cuando se expone a esas condicio- 
nes ambientales cambiantes se denomina producto robusto o proceso robusto. (Véase 
Myers, Montgomery y Anderson-Cook, 2009, en la bibliografía). 


control y ruido 


Taguchi (1991) destacó la idea de utilizar dos clases de variables de diseño en un estudio 
que incluye un diseño de superficie de respuesta (DSR): factores de control y factores 
de ruido. 


Los factores de control son variables que se pueden controlar tanto en el experimento 
como en el proceso. Los factores de ruido son variables que pueden o no controlarse 
en el experimento, pero que no pueden controlarse en el proceso (o que no pueden con- 
trolarse bien). 


Un método importante consiste en usar variables de control y variables de ruido en 
el mismo experimento, como efectos fijos. Para lograr esto con frecuencia se utilizan los 
diseños o arreglos ortogonales. 


Meta del diseño 
robusto de 
parámetros 


La meta del diseño robusto de parámetros es elegir los niveles de las variables de control, 
es decir, el diseño del proceso, que sean más robustos (insensibles) a los cambios en las 
variables de ruido. 


Debe señalarse que los cambios en las variables de ruido en realidad implican cambios 
durante el proceso, cambios en el campo, cambios en el ambiente, cambios en el manejo 
о uso por parte del consumidor, etcétera. 


Arreglo del producto 


Un enfoque del diseño de experimentos que incluye tanto variables de control como de 
ruido consiste en utilizar un plan experimental que requiere un diseño ortogonal para 
las variables de control y de ruido, por separado. Entonces, el experimento completo es 
simplemente el producto o cruce de estos dos diseños ortogonales. El siguiente es un 
ejemplo sencillo de un arreglo de productos con dos variables de control y dos de ruido. 
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Ejemplo 15.9: | En el artículo “The Taguchi Approach to Parameter Design” en Quality Progress, de 
diciembre de 1987, D. M. Byrne y S. Taguchi analizan un ejemplo interesante en el 
que se busca un método para ensamblar un conector electrométrico a un tubo de nailon que 
entrega el rendimiento de arranque requerido para una aplicación de motor automotriz. 
El objetivo es encontrar condiciones controlables que maximicen la fuerza de arranque. 
Entre las variables controlables están A, el espesor de la pared del conector, y B, la pro- 
fundidad de inserción. Durante la operación rutinaria existen diversas variables que no 
se pueden controlar, aunque se controlan durante el experimento. Entre ellas están C, el 
tiempo de acondicionamiento, y D, la temperatura de acondicionamiento. Se toman tres 
niveles para cada variable de control y dos para cada variable de ruido. Como resultado, 
el arreglo cruzado es el siguiente. Se trata de un arreglo de control de 3 x 3 y el de ruido 
es el conocido factorial 2? con (1), c, d y cd que representan las combinaciones de los 
cuatro factores. El propósito del factor de ruido es crear la clase de variabilidad de la 
respuesta, la fuerza de arranque, que se podría esperar en la operación diaria con el 
proceso. En la tabla 15.18 se muestra el diseño. И | 


Tabla 15.18: Diseño para el ejemplo 15.9 


B (profundidad) 
Superficial. Media Profunda 
Delgado (1) (1) (1) 
С. С С. 
а а а 
са са са 
Medio (1) (1) (1) 
С С С 
А (espesor de pared) d d d 
cd cd cd 
Grueso (1) (1) (1) 
С C С 
а а а 
са са са 


Estudio de caso 15.3: | Optimización de proceso de soldadura. En un experimento que Schmidt y Launsby 
describen en Understanding Industrial Designed Experiments (1991; véase la bibliogra- 
fía), en una planta de ensamble de circuitos integrados se lleva a cabo la optimización de 
un proceso de soldadura. Las partes se insertan a mano o en forma automática en una 
tarjeta que tiene impreso un circuito. Una vez que las partes se insertan, la tarjeta se co- 
loca en una máquina soldadora de ola que se emplea para conectar todos los elementos 
del circuito. Las tarjetas se colocan en un transportador y pasan por una serie de etapas. 
Se lavan en una mezcla fundente para eliminar el óxido. Para minimizar la torsión se 
precalientan antes de aplicar la soldadura, la cual se realiza conforme las tarjetas se mue- 
ven a través de la ola de soldadura. El objetivo del experimento consiste en minimizar el 
número de defectos de soldadura por millón de uniones. Los factores y los niveles de 
control se incluyen en la tabla 15.19. 
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Tabla 15.19: Factores de control para el estudio de caso 15.3 


Factor (1) (+1) 
A, temperatura del crisol para soldar (°F) 480 510 
B, velocidad del transportador (pies /min) ШУ, 10 
С, densidad del fundente 0.92 1.02 
D, temperatura de precalentado 150 200 
E, altura de la ola (pulgadas) 0.5 0.6 


A nivel experimental es fácil controlar estos factores, pero en la planta o en el proceso es 
mucho más difícil. J 


Factores de ruido: tolerancias sobre los factores de control 


A menudo, en procesos como éste los factores naturales de ruido son las tolerancias 
sobre los factores de control. Por ejemplo, en el proceso real en línea la temperatura del 
crisol para soldar y la velocidad de la banda transportadora son difíciles de controlar. Se 
sabe que el control de la temperatura está dentro de +5°F, y que el control de la veloci- 
dad de la banda está dentro de +0.2 pies/min. Es posible que la variabilidad de la res- 
puesta del producto (desempeño de la soldadura) se incremente debido a la incapacidad 
de controlar esos dos factores en ciertos niveles nominales. El tercer factor de ruido es el 
tipo de ensamble involucrado. En la práctica se utilizan uno de dos tipos de ensambles. 
Así, se tienen los factores de ruido que se presentan en la tabla 15.20. 


Tabla 15.20: Factores de ruido para el estudio de caso 15.3 


Factor (—1) (+1) 
A*, tolerancia de la temperatura del crisol para soldar (°F), —5 +5 
(desviación de la nominal) 
B*, tolerancia de la velocidad del transportador (pies/min), —0.2 +0.2 
(desviación del ideal) 
C*, tipo de ensamble 1 2 


Se eligieron factoriales fraccionados tanto para el arreglo de control (arreglo in- 
terior) como para el de ruido (arreglo exterior): el primero es - de un diseño 25, y el 
segundo es > de un diseño 2*. El arreglo cruzado y los valores de respuesta se presen- 
tan en la tabla 15.21. Las primeras tres columnas del arreglo interior representan un 
diseño 2°. La cuarta y la quinta columnas están formadas рог D = —AC y E = —BC. 
Así, las interacciones de definición para el arreglo interior son ACD, BCE y ABDE. 
El arreglo exterior es una fracción estándar de resolución Ш de un diseño 25. Observe 
que cada punto del arreglo interior contiene corridas del arreglo exterior. Así, se obser- 
van cuatro valores de respuesta en cada combinación del arreglo de control. La figura 


15.19 muestra gráficas que revelan el efecto de la temperatura y la densidad sobre la 
respuesta media. 
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Tabla 15.21: Arreglos cruzados y valores de respuesta para el estudio de caso 15.3 


Arreglo interior Arreglo exterior 
A В C D ә Е | (1) аф ařc* břc* ў Sy 
1 1 1 —1 —1 |194 197 193 275 214.75 40.20 
1 1 —1 1 1| 136 136 132 136 135.00 2.00 
1 -1 1 -—1 1| 185 261 264 264 243.50 39.03 
1 -1 —1 1 -1| 47 125 127 42 85.25 47.11 
—1 1 1 1 —1 |295 216 204 293 252.00 48.75 
—1 1 -1 —1 1 | 234 159 231 157 195.25 43.04 
=1 -l1 1 1 1 | 328 326 247 322 305.75 39.25 
—1 -1 -1 —1 —1 |186 187 105 104 145.50 47.35 


Temperatura del crisol para soldar Densidad del fundente 
250 250 * 
+ 
> > 
e А 
S 185 S 185 
Ф Ф 
> + > 
+ 
120 120 
Baja Alta Baja Alta 


(=1) (+1) (=1) (+1) 


Figura 15.19: Gráfica que muestra la influencia de los factores sobre la respuesta media. 


Análisis simultáneo de la media y varianza del proceso 


En la mayoría de los ejemplos que utilizan DSR el analista se interesa por encontrar 
condiciones para las variables de control que proporcionen valores adecuados para la 
respuesta media y. Sin embargo, la variación de las variables de ruido proporciona in- 
formación acerca de la varianza del proceso оў que podría anticiparse еп el mismo. Es 
evidente que un producto robusto es aquel para el que el proceso es consistente y, por lo 
tanto, tiene poca varianza. El DSR puede incluir el análisis simultáneo de y y s. 
Resulta que la temperatura y la densidad del fundente son los factores más impor- 
tantes en el estudio de caso 15.3, y al parecer influyen en s, y y. Por fortuna, para ambas 
es preferible una alta temperatura y una baja densidad del fundente. De acuerdo con la 


“A 


figura 15.19 las condiciones “óptimas” son 


temperatura de soldadura = 510°Е, densidad del fundente = 0.9°. 
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Enfoques alternativos al diseño robusto de parámetros 


Un enfoque sugerido por muchos estudiosos consiste en modelar la media y la varianza 
muestrales por separado. Con frecuencia el modelado separado ayuda al experimentador 
a comprender mejor el proceso involucrado. En el siguiente ejemplo se ilustra este enfo- 
que con el experimento del proceso de soldadura. 


Estudio de caso 15.4: | Considere los datos del estudio de caso 15.3. Un método alternativo consiste en ajustar 
modelos separados para la media y y la desviación estándar muestral. Suponga que se 
usa el código habitual +1 y —1 para los factores de control. Con base en la importancia 
aparente de la temperatura del crisol para soldar х, y la densidad del fundente x,, la re- 
gresión lineal sobre la respuesta (número de errores por millón de uniones) produce 


$ = 197.125 — 27.5x, + 57.875x,, 


Para obtener los niveles más robustos de la temperatura y la densidad del fundente 
es conveniente establecer un compromiso entre la respuesta media y la variabilidad, y 
para esto es necesario modelar la variabilidad. Una herramienta importante para hacerlo 
es la transformación logarítmica (véase Bartlett y Kendall, 1946, o Carroll y Ruppert, 
1988): 


In? = 7, + у(х) +70). 


Este proceso de modelado produce el siguiente resultado: 


In s? = 6.6975 — 0.7458x, + 0.6150x,. 


El modelo logarítmico lineal tiene un amplio uso en el modelado de la varianza mues- 
tral, ya que la transformación logarítmica de la varianza muestral se presta al uso del 
método de mínimos cuadrados. Esto resulta del hecho de que las suposiciones de nor- 
malidad y de varianza homogénea a menudo son muy buenas cuando se utiliza In s? en 
lugar de s? como respuesta del modelo. 

El análisis que es importante para el científico o el ingeniero echa mano de los dos 
modelos al mismo tiempo. Un método gráfico puede ser muy útil. La figura 15.20 pre- 
senta al mismo tiempo gráficas sencillas de los modelos de la media y de la desviación 
estándar. Como se esperaría, la ubicación de la temperatura y la densidad del fundente 
que minimizan el número medio de errores es la misma que la que minimiza la variabi- 
lidad, es decir, temperatura alta y densidad del flujo baja. El método gráfico de la super- 
ficie múltiple de respuesta permite que el usuario perciba intercambios entre la media 
del proceso y su variabilidad. Para este ejemplo es probable que el ingeniero se sienta 
insatisfecho con las condiciones extremas de la temperatura de la soldadura y la densi- 
dad del fundente. La figura ofrece estimados de lo que se pierde a medida que uno se 
aleja de las condiciones óptimas de la media y la variabilidad hacia cualquier condición 
intermedia. J 

En el estudio de caso 15.4 para las variables de control se eligieron valores que 
proporcionaran condiciones deseables tanto para la media como para la varianza del 
proceso. Se tomaron la media y la varianza a través de la distribución de las variables 
de ruido en el proceso y se modelaron por separado, y se encontraron condiciones apro- 
piadas por medio de un método doble de superficie de respuesta. Como el estudio de 
caso 15.4 incluye dos modelos (media y varianza) podría considerarse un análisis doble 
de superficie de respuesta. Por fortuna, en este ejemplo las mismas condiciones de las 
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хә, Densidad del fundente 
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ху, Temperatura 


Figura 15.20: Media y desviación estándar del estudio de caso 15.4. 


dos variables de control relevantes, la temperatura y la densidad del fundente, eran las 
óptimas para la media y la varianza del proceso. En la práctica la mayoría de las veces es 
necesario apelar a algún tipo de compromiso entre la media y la varianza. 

El método que se ilustra en el estudio de caso 15.4 implica encontrar condiciones 
óptimas para el proceso cuando los datos que se utilizan provienen de un tipo de diseño 
experimental con arreglo de producto (o arreglo cruzado). Con frecuencia el uso de un 
arreglo de producto, un cruce entre dos diseños, es muy costoso. Sin embargo, el desa- 
rrollo de modelos dobles de superficie de respuesta, es decir, un modelo para la media y 
otro para la varianza, se puede lograr sin un arreglo de producto. El diseño que incluye 
tanto variables de control como de ruido se conoce como arreglo combinado. Este tipo 
de diseño y el análisis resultante se puede usar para determinar cuáles condiciones de las 
variables de control son las más robustas (insensibles) a la variación de las variables de 
ruido. Esto se puede considerar equivalente a encontrar niveles de control que minimicen 
la varianza del proceso producida por el movimiento de las variables de ruido. 


El papel de la interacción control por ruido 


La estructura de la varianza del proceso es determinada en gran medida por la naturaleza 
de la interacción control por ruido. La naturaleza de la falta de homogeneidad de la va- 
rianza del proceso depende de cuáles variables de control interactúan con cuáles varia- 
bles de ruido. De manera específica, como se ilustrará, aquellas variables de control que 
interactúan con una o más variables de ruido podrían ser objeto del análisis. Por ejemplo, 
considere un caso citado por Myers, Montgomery y Anderson-Cook (2009), el cual in- 
cluye dos variables de control y una variable de ruido con los datos que se incluyen en la 
tabla 15.22. A y B son las variables de control y C es la variable de ruido. 
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Tabla 15.22: Datos experimentales en un arreglo cruzado 


Arreglo interno Arreglo externo 
A B C=-1 C =+1 Media de respuesta 
—1 —1 11 15 13.0 
—1 1 7 8 7.9 
1 —1 10 26 18.0 
1 1 10 14 12.0 


Podemos ilustrar las interacciones АС у ВС con gráficas, como se observa еп la 
figura 15.21. Es necesario entender que mientras A y B se mantienen constantes en el 
proceso, C sigue una distribución de probabilidad durante el mismo. Dada esta informa- 
ción, queda claro que A = —1 y В = +1 son niveles que producen valores más pequeños 
para la varianza del proceso, en tanto que A = +1 y B = —1 producen valores más 
grandes. Así, se dice que A = —1 y В = +1 son valores robustos, es decir, insensibles a 
cambios inevitables en la variable de ruido C durante el proceso. 


ч С +1 =1 С +1 


a) Gráfica de interacción АС. b) Gráfica de interacción BC. 


Figura 15.21: Gráficas de interacción para los datos de la tabla 15.22. 


En el ejemplo anterior se dice que tanto A como B son efectos de dispersión, es 
decir, que ambos factores afectan la varianza del proceso. Asimismo, ambos factores son 
efectos de la ubicación, ya que la media de y cambia conforme los dos factores pasan 
ае –1 а +1. 


Análisis que incluye el modelo que contiene variables de control 
y de ruido 


Aunque se ha hecho énfasis en que las variables de ruido no permanecen constantes du- 
rante el funcionamiento del proceso, el análisis da como resultado condiciones deseables 
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o incluso óptimas y proporciona de manera directa e indirecta información útil sobre el 
proceso. El modelo de respuesta es, en realidad, un modelo de superficie de respuesta 
en el vector x y en el vector z, donde x contiene variables de control y z las variables 
de ruido. Ciertas operaciones permiten generar modelos para la media y la varianza del 
proceso similares a los del estudio de caso 15.4. En Myers, Montgomery y Anderson- 
Cook (2009) se proporcionan los detalles; aquí se ilustrará con un ejemplo muy sencillo. 
Considere los datos de la tabla 15.22 de la página 650 con las variables de control A y B 
y la variable de ruido С. Hay ocho corridas experimentales еп un factorial 2? х 2 o 2°. 
Así, podemos escribir el modelo de respuesta como 


02) = 8, FB tbt В ter teI е. 


No se incluirán las interacciones de tres factores en el modelo de regresión. A, B y C de 
la tabla 15.22 están representados en el modelo por medio de х, x, y z, respectivamente. 
Se supone que el término del error € posee las propiedades acostumbradas de indepen- 
dencia y varianza constante. 


Las superficies de respuesta de la media y la varianza 


Es más fácil comprender las superficies de respuesta de la media y la varianza del pro- 
ceso si consideramos la esperanza y la varianza de z a lo largo del proceso. Se supone que 
la variable de ruido С [denotada рог z еп у(х, 2)] es continua, con media igual а cero y va- 
rianza о2. Los modelos de la media y la varianza del proceso se pueden considerar como 


Е. [у(х,2)| = Po + Вх; + B2x2 + B12X1X2, 
Маг: [у(х, &)] = о? +08 + 8х1 + 2x2)? = т^ +0212, 
donde / es la pendiente —57— дуба ? en la dirección de z. Como se indicó antes, debemos ob- 
servar que las ое оа “de los factores A y B con la variable de ruido C son compo- 
nentes fundamentales de la varianza del proceso. 

Aunque ya se analizó este ejemplo por medio de las gráficas de la figura 15.21, las 
cuales revelan el papel de las interacciones AB y AC, es aleccionador ver el análisis con- 
siderando E [y(x, z)] y Var [yGx, 2)]. En este ejemplo el lector puede verificar fácilmente 
que el estimado b, para B. es 15/8, mientras que el estimado de Б, рага 3, es —15/8. 
El coeficiente b, = - 25/8. ASÍ, la condición x, = +1 y x, = —1 resulta en un estimado de 
la varianza del proceso de 


Var. [у(х, z)] = 0? +02(b3 + Б, ху + Бох)? 


a, [25 (15 -15 e с. 


en tanto que para х, = —1 y x, = 1 tenemos 


Var. уб, z)] = ©? + 02(b3 + ху + 6,0) 


Е 25 (15 15 #® се. ууз \ 
=0 АЕ (F je D+ (5) o] =0 +0; (3) Я 


De esta manera, para Іа condición más deseable (robusta) de х = —1 y х, = 1, la 
varianza del proceso estimada debido a la variable de ruido С (о 2) еѕ (25/64)07. 
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La condición más indeseable, la de máxima varianza del proceso, es decir, x, = +1 y x, 
= — 1, produce una varianza del proceso estimada de (3025/64)07. En lo que se refiere a 
la respuesta media, la figura 15.21 indica que si se desea una respuesta máxima, entonces 
x, = +1 y x, = —1 produce el mejor resultado. 


Z] 


+1 
a) Gráfica de interacción х2. 


y 


+1 
b) Gráfica de interacción x,z. 


Figura 15.22: Gráficas de interacción para los datos del ejercicio 15.31. 


Ejercicios 


15.31 Considere un ejemplo en el que hay dos va- 
riables de control: x, y х„ y una variable de ruido z. El 
objetivo consiste en determinar los niveles de x, y x,, 
que son robustos ante los cambios de z, es decir, los 
niveles de x, y x, que minimizan la varianza producida 
en la respuesta y cuando z se mueve entre —1 a +1. Las 
variables x, y x, se encuentran a dos niveles, —1 y +1 
en el experimento. Los datos producen las gráficas de 
la figura 15.22. Observe que x, y x, interactúan con la 
variable de ruido z. ¿Qué parámetros de x, y x, (—1 o 
+1 para cada uno) producen la varianza mínima en y? 
Explique sus resultados. 


15.32 Considere el siguiente factorial 2° con varia- 
bles de control x, y x, y variable de ruido z. ¿Es posi- 
ble elegir x, y x, en niveles que minimicen a Var(y)? 
Explique su respuesta. 


X1 


-1 4 6 8 10 
ХІ 3 


+1 1 3 


15.33 Considere el estudio de caso 15.1 del mol- 
deado por inyección. Suponga que es difícil contro- 
lar la temperatura de moldeado y, por lo tanto, que 
se puede asumir que en el proceso sigue una distri- 
bución normal con media igual а cero y varianza 07. 


El interés se centra en la varianza de la respuesta de 
contracción del propio proceso. Dentro del análisis 
de la figura 15.7 es evidente que la temperatura de 
moldeado, la velocidad de inyección y la interac- 
ción de ambos son los únicos factores importantes. 


a) ¿El parámetro de la velocidad se podría usar para 
crear algún tipo de control de la varianza del pro- 
ceso en la contracción que surja debido a la impo- 
sibilidad de controlar la temperatura? Explique su 
respuesta. 

b) Utilice los estimados de parámetros de la figura 
15.7 y proporcione un estimado de los siguientes 
modelos: 

1) contracción media a lo largo de la distribu- 
ción de la temperatura; 

ii) varianza de la contracción como función de 
сї, 

с) Utilice el modelo de la varianza estimada para 
determinar el nivel de velocidad que minimiza la 
varianza de la contracción. 

d) Utilice el modelo de la contracción media para 
determinar qué valor de la velocidad minimiza la 
contracción media. 

e) ¿Los resultados anteriores son consistentes con 
su análisis de la gráfica de interacción de la figura 
15.6? Explique su respuesta. 


15.34 En el estudio de caso 15.2 acerca de los datos 
de la purificación de carbón se sabe que el porcentaje 


Ejercicios de repaso 


de sólidos en el sistema del proceso varía de manera 
incontrolable durante el proceso y es considerado como 
un factor de ruido con media igual a 0 y varianza 07. La 
respuesta, la eficiencia de la pureza, tiene una media y 
una varianza que cambian de comportamiento durante 
el proceso. Utilice sólo términos significativos en los 
siguientes incisos. 

a) Utilice los estimados de la figura 15.9 para desa- 
rrollar los modelos de la varianza y la eficiencia 
media del proceso. 

b) ¿Qué factor (o factores) podrían controlarse a cier- 
tos niveles para controlar o minimizar la varianza 
del proceso? 

с) ¿Qué condiciones o factores В y С dentro de la 
región del diseño maximizan la media estimada? 

d) ¿Qué nivel de C sugeriría para minimizar la va- 


rianza del proceso cuando В = 1? ¿Y cuando B = 
—1? 


15.35 Use los datos de purificación del carbón del 
ejercicio 15.2 de la página 609 para ajustar un modelo 
del tipo 


E(Y) = Bo F Bx, + Вх, + Вх, 


Ejercicios de repaso 


15.39 Se utilizó un diseño de Plackett-Burman para 
estudiar las propiedades reológicas de los copolímeros 
de alto peso molecular. En el experimento se fijaron dos 
niveles para cada una de seis variables. La respuesta es la 
viscosidad del polímero. Los datos fueron analizados en 
el Centro de Consultoría en Estadística de Virginia Tech, 
por personal del Departamento de Ingeniería Química 
de la universidad. Las variables son las siguientes: quí- 
mica del bloque duro x,, tasa de flujo de nitrógeno x,, 
tiempo de calentamiento x,, porcentaje de compresión 
X, mediciones (alta y baja) x,, porcentaje de esfuerzo x,. 
A continuación se presentan los datos 


Observación х X2 X3 X4 X5 X6 y 
1 1 —1 1 —1 —1 —1 194,700 
2 1 1 —1 1 —1 —1 588,400 
3 —1 1 1 —1 1 —1 7533 
4 1 —1 1 1 —1 1 514,100 
5 1 1 -1 1 1 —1 277,300 
6 1 1 1 —1 1 1 493,500 
7 —1 1 | 1 —1 1 8969 
8 =1 —1 1 1 1 —1 18,340 
9 =1 —1 —1 1 1 1 6793 
10 1—1 -1 —1 1 1 160,400 
11 —1 1 —1 —1 — 1 7008 
12 —1 -1 -1 -1 —1 -1 3637 


Construya una ecuación de regresión que relacione 
la viscosidad con los niveles de las seis variables. 
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donde los niveles son 


X, porcentaje de sólidos: 8, 12 
X, tasa de flujo: 150, 250 gal/min 
Xy РН: 5,6 


Centre у escale las variables a las unidades de diseño. 
Asimismo, realice una prueba para la falta de ajuste y 
haga comentarios acerca de lo adecuado del modelo de 
regresión lineal. 


15.36 Se utiliza un plan factorial 2% para construir 
un modelo de regresión que contenga coeficientes de 
primer orden y términos del modelo para todas las in- 
teracciones de dos factores. Para cada factor se realizan 
corridas duplicadas. Construya la tabla de análisis de 
varianza que muestre los grados de libertad para la re- 
gresión, la falta de ajuste y el error puro. 


15.37 Considere la fracción тє del factorial 27 que se 
estudió en la sección 15.9. Liste los 11 contrastes de 
definición adicionales. 


15.38 Construya un diseño de Plackett-Burman para 
10 variables que contengan 24 corridas experimentales. 


Realice pruebas £ para todos los efectos principales. 
Recomiende los factores a conservar para estudios fu- 
turos y los factores a eliminar. Use el cuadrado medio 
residual (5 grados de libertad) como medida del error 
experimental. 


15.40 Una empresa petrolera grande del suroeste 
lleva a cabo experimentos de manera regular para pro- 
bar los aditivos de los fluidos de perforación. La vis- 
cosidad plástica es una medición reológica que refleja 
el espesor del fluido. Se agregan varios polímeros al 
fluido para incrementar su viscosidad. A continuación 
se presenta un conjunto de datos en el que se usaron 
dos polímeros, con dos niveles cada uno, y se midió la 
viscosidad. La concentración de los polímeros se in- 
dica como “baja” y “alta”. Haga un análisis del experi- 
mento factorial 22. Pruebe los efectos e interacción de 
los dos polímeros. 


Polímero 1 


Polímero 2 Baja Alta 
Baja 3.0 3:9 11.3 12.0 
Alta 11.7 12.0 21.7 22.4 


15.41 Se analiza un experimento factorial 2? en 
el Centro de Consultoría en Estadística de Virginia 
Tech. El cliente es miembro del Department of Hou- 
sing, Interior Design, and Resource Management y 
le interesa comparar hornos de arranque en frío y de 
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precalentamiento en términos de la energía total que 
se entrega al producto, y, además, comparar las condi- 
ciones de convección con el modo regular. Se hicieron 
cuatro corridas experimentales con cada una de las cua- 
tro combinaciones de los factores. A continuación se 
presentan los datos del experimento: 


Precalentamiento Frío 
Modo de 618 619.3 | 575 573.7 
convección 629 611 574 572 
Modo 581 585.7 | 558 562 
regular 581 595 562 566 


Haga un análisis de varianza para estudiar la interac- 
ción y los efectos principales. Saque sus conclusiones. 


15.42 En el estudio “The Use of Regression 
Analysis for Correcting Matrix Effects in the X-Ray 
Fluorescence Analysis of Pyrotechnic Compositions”, 
publicado en Proceedings of the Tenth Conference 
on the Design of Experiments in Army Research 
Development and Testing, ARO-D Report 65-3 (1965), 
se realizó un experimento donde se hicieron variar las 
concentraciones de cuatro componentes de una mezcla 
de propulsor y los pesos de partículas finas y gruesas 
en la suspensión. Los factores A, B, C y D, cada uno 
en dos niveles, representan las concentraciones de los 
cuatro componentes, y los factores E y F, también en 
dos niveles, representan los pesos de las partículas finas 
gruesas que hay en la suspensión. El objetivo del aná- 
lisis era determinar si las relaciones de intensidad de 
rayos X asociadas con el componente 1 del propulsor 
eran influidas en forma significativa por la variación de 
las concentraciones de los distintos componentes y los 
pesos de las partículas, según su tamaño, en la mezcla. 
Se utilizó una fracción de $ de un experimento factorial 
2% con los contrastes de definición ADE, BCE у ACF. 
Los datos siguientes representan el total de un par de 
lecturas de intensidad. 
El cuadrado medio del error agrupado con 8 grados de 
libertad es dado por 0.02005. Analice los datos utili- 
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zando un nivel de significancia de 0.05 para determinar 
si las concentraciones de los componentes y los pesos 
de las partículas finas y gruesas presentes en la suspen- 
sión influyen de manera significativa en las relaciones 
de intensidad asociadas con el componente 1. Suponga 
que no existe interacción entre los seis factores. 


Combinación Relación total 
Lote de tratamientos de intensidad 
1 abef 2.2480 
2 cdef 1.8570 
3 (1) 2.2428 
4 ace 2.3270 
5 bde 1.8830 
6 abcd 1.8078 
7 adf 2.1424 
8 һе] 1.9122 


15.43 Utilice la tabla 15.16 para construir un diseño 
de 16 corridas con 8 factores que tenga resolución IV. 


15.44 Enel ejercicio de repaso 15.43, compruebe que 
el diseño en efecto tiene resolución IV. 


15.45 Construya un diseño que contenga 9 puntos de 
diseño, sea ortogonal, contenga un total de 12 corridas 
y 3 grados de libertad para el error de réplica, y también 
que permita hacer una prueba de falta de ajuste para la 
curvatura cuadrática pura. 


15.46 Considere un diseño 2;,,' con 2 corridas cen- 
trales. Considere y, como la respuesta promedio en el 
parámetro de diseño y y, como la respuesta promedio 
en el centro del diseño. Suponga que el verdadero mo- 
delo de la regresión es 


EY) = B, + Bx, + 8х, + B,%,, 
+ 8х1 + 8,3 + By 


а) Proporcione (y compruebe) EQ, = Ya). 
b) Explique lo que haya aprendido del resultado del 
inciso a 


Posibles riesgos y errores conceptuales; 


relación con el material de otros capítulos 


En el empleo de experimentos factoriales fraccionados uno de los aspectos más importan- 
tes que debe atender el analista es la resolución del diseño. Un diseño de resolución baja 
es más pequeño y, por lo tanto, menos costoso que uno de mayor resolución. Sin embargo, 
se paga un precio por el diseño más barato. El diseño de menor resolución tiene alias más 
pesados que uno de resolución mayor. Por ejemplo, si el investigador sospecha que las 
interacciones de dos factores son importantes, entonces no debería emplear la resolución 
Ш. Un diseño de resolución Ш es estrictamente un plan de efectos principales. 


Capítulo 16 


Estadística no paramétrica 


16.1 Pruebas no paramétricas 


La mayoría de los procedimientos de prueba de hipótesis que se presentaron en los capí- 
tulos anteriores se basan en la suposición de que las muestras aleatorias se seleccionan 
de poblaciones normales. Por fortuna la mayor parte de estas pruebas aún son confiables 
cuando existen ligeras desviaciones de la normalidad, en particular cuando el tamaño de 
la muestra es grande. Tradicionalmente, a tales procedimientos de prueba se les denomi- 
na métodos paramétricos. En este capítulo consideramos varios procedimientos de 
prueba alternativos, llamados métodos no paramétricos o de distribución libre, que a 
menudo no suponen conocimiento de ninguna clase acerca de las distribuciones de las 
poblaciones subyacentes, excepto, quizá, que éstas son continuas. 

Los analistas de datos están usando procedimientos no paramétricos o de distribu- 
ción libre cada vez con mayor frecuencia. En la ciencia y la ingeniería hay muchas 
aplicaciones en las que los datos no se reportan como valores de un continuo, sino, 
más bien, como una escala ordinal en la que es natural asignar rangos a los datos. De 
hecho, en este capítulo el lector notará muy pronto que los métodos de distribución 
libre aquí descritos implican un análisis de rangos. La mayoría de los analistas consi- 
deran que los cálculos involucrados en los métodos no paramétricos son muy atractivos 
e intuitivos. 

Para revisar un ejemplo donde se aplica una prueba no paramétrica considere la si- 
tuación en que dos jueces deben clasificar cinco marcas de cerveza de alta calidad asig- 
nando la categoría 1 a la marca que se considera que tiene la mejor calidad general, la 
categoría 2 a la segunda mejor, y así sucesivamente. Luego se puede utilizar una prueba 
no paramétrica para determinar si existe algún acuerdo entre los dos jueces. 

También debemos señalar que las pruebas no paramétricas tienen asociadas varias 
desventajas. La primera es que no utilizan toda la información que proporciona la mues- 
tra, por lo tanto, cuando se pueden aplicar ambos métodos, estas últimas muestran ser 
menos eficientes que el procedimiento paramétrico correspondiente. En consecuencia, 
para lograr la misma potencia que la prueba paramétrica correspondiente, una prueba no 
paramétrica requerirá un tamaño muestral mayor que el que requeriría la primera. 

Como antes indicamos, ligeras desviaciones de la normalidad dan como resultado 
desviaciones menores del ideal para las pruebas paramétricas estándar. Esto es particu- 
larmente cierto para la prueba £ y la prueba F. En el caso de la prueba ѓу la prueba F, el 
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valor P citado podría tener un ligero error si se transgrediera moderadamente la suposi- 
ción de normalidad. 

En resumen, si se puede aplicar tanto una prueba paramétrica como una no paramé- 
trica al mismo conjunto de datos, se debe aplicar la técnica paramétrica más eficiente. 
Sin embargo, es importante reconocer que a menudo no es posible justificar las suposi- 
ciones de normalidad, y que no siempre contamos con medidas cuantitativas. Es una 
ventaja que los estadísticos nos brinden diversos procedimientos no paramétricos útiles. 
Armado con las técnicas no paramétricas, el analista de datos tiene más herramientas 
para adaptar una variedad más amplia de situaciones experimentales. Se debe señalar 
que incluso basándose en las suposiciones de la teoría normal estándar, la eficiencia de 
las técnicas no paramétricas se acerca mucho más a la del procedimiento paramétrico 
correspondiente. Por otro lado, las grandes desviaciones de la normalidad hacen que el 
método no paramétrico sea mucho más eficiente que el procedimiento paramétrico. 


Prueba de signo 


El lector debería recordar que los procedimientos que se estudiaron en la sección 10.4 
para probar la hipótesis nula de que и = pu, son válidos sólo si la población es aproxima- 
damente normal o si la muestra es grande. Sin embargo, si n < 30 y la población deci- 
didamente no es normal, debemos recurrir a una prueba no paramétrica. 

La prueba de signo se utiliza para probar hipótesis sobre una mediana de la población. 
En el caso de muchos de los procedimientos no paramétricos, la media es reemplazada 
por la mediana como el parámetro de ubicación pertinente a probar. Recuerde que la 
mediana muestral se definió en la sección 1.3. El equivalente de la población, que se 
denota con Ñ, tiene una definición análoga. Dada una variable aleatoria X, р se define de 
modo que Р(Х > р) < 0.5 y P(X < р) < 0.5. En el caso continuo, 


P(X > ñ) = Р(Х < р) = 0.5. 


Por supuesto, si la distribución es simétrica, la media y la mediana de la población son 
iguales. Al probar la hipótesis nula Н, de que р = Деп comparación con la hipótesis 
alternativa adecuada, con base en una muestra aleatoria de tamaño n, reemplazamos 
cada valor de la muestra que exceda a Д соп un signo más, y cada valor de la muestra 
menor que р, соп un signo menos. Si la hipótesis nula es verdadera у la población es 
simétrica, la suma de los signos más debería ser casi igual a la suma de los signos menos. 
Cuando un signo aparece con más frecuencia de lo que debería, con base sólo en el azar, 
rechazamos la hipótesis de que la mediana de la población fi es igual a ñ. 

En teoría, la prueba de signo sólo se puede aplicar en situaciones en las que Д no 
puede ser igual al valor de cualquiera de las observaciones. Aunque la probabilidad de 
obtener una observación muestral exactamente igual a (4, cuando la población es conti- 
nua es de cero, еп la práctica un valor de la muestra igual a [1, ocurre con frecuencia 
debido a una falta de precisión en el registro de los datos. Cuando se observan valores de 
la muestra iguales a j, se excluyen del análisis, lo cual da como resultado que se reduz- 
ca el tamaño de la muestra. 

El estadístico de prueba adecuado para la prueba de signo es la variable aleatoria 
binomial X, que representa el número de signos más en la muestra aleatoria. Si la hipó- 
tesis nula de que р = Д es verdadera, la probabilidad de que un valor muestral dé como 
resultado un signo más o uno menos es igual a 1/2. Por lo tanto, para probar la hipótesis 
nula de que fi = [1,, en realidad probamos la hipótesis nula de que el número de signos 
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más es un valor de una variable aleatoria que tiene una distribución binomial con el pa- 
rámetro p = 1/2. Por lo tanto, los valores P para las alternativas unilateral y bilateral se 
pueden calcular usando esta distribución binomial. Por ejemplo, probando 


Ho: р = flo, 
H;: Ё < Ёо, 
se rechaza H, a favor de Н, sólo si la proporción de signos más es lo suficientemente 


menor que 1/2, es decir, cuando el valor x de la variable aleatoria es pequeño. Por lo 
tanto, si el valor P que se calcula 


P =P (X < x cuando р = 1/2) 


es menor o igual que algún nivel de significancia œ preseleccionado, se rechaza H, а 
favor de H. Por ejemplo, cuando n = 15 y x = 3, en la tabla А.І encontramos que 


3 
- 1 
Р = P(X < 3 cuando p = 1/2) = > b (к IS; 5) = 0.0176, 
x=0 


de manera que la hipótesis nula р = (4, realmente se puede rechazar a un nivel de signi- 
ficancia de 0.05 pero no a un nivel de 0.01. 
Para probar la hipótesis 


Ho: fi = Во, 
Hy: fi > ño, 


se rechaza H, a favor de Н sólo si la proporción de signos más es suficientemente mayor 
que 1/2, es decir, cuando x es grande. En consecuencia, si el valor P calculado 


P=P(X > x cuando p = 1/2) 
es menor que Q, se rechaza H, a favor de H. Finalmente, para probar la hipótesis 
Ho: р = Ho, 
Ну: р # flo, 
se rechaza H, а favor de H, cuando la proporción de signos más es significativamente 


menor o mayor que 1/2. Esto, por supuesto, es equivalente a que x sea tan pequeña o tan 
grande como se requiere. Por lo tanto, si x < n/2 y el valor P calculado 


Р = 2Р(Х < x cuando р = 1/2) 
es menor o igual que о, o si x > n/2 y el valor P calculado 


P = 2P(X > x cuando p = 1/2) 


es menor o igual que о, se rechaza H, a favor de H. 
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Siempre que n > 10, las probabilidades binomiales con p = 1/2 se pueden aproxi- 
mar a partir de la curva normal, ya que np = nq > 5. Suponga, por ejemplo, que desea- 
mos probar la hipótesis 


Ho: б = ро, 
Hı: fi < ро, 
a un nivel de significancia œ = 0.05 para una muestra aleatoria de tamaño п = 20 que 


produce x = 6 signos más. Si utilizamos la aproximación de la curva normal con 


Ё = пр = (20)(0.5) = 10 


o = \/прд = y (20)(0.5)(0.5) = 2.236, 


encontramos que 


6.5 – 10 
Por lo tanto, 
Р = P(X < 6) = P(Z < —1.57) = 0.0582, 


que conduce a no rechazar la hipótesis nula. 


Ejemplo 16.1: | Los siguientes datos representan el número de horas que funciona una desbrozadora 


Solución: 


antes de requerir una recarga: 


1.5, 2.2, 0.9, 1.3, 2.0, 1.6, 1.8, 1.5, 2.0, 1.2, 1.7. 


A un nivel de significancia de 0.05 utilice la prueba de signo para probar la hipótesis de 
que esta desbrozadora específica funciona con una mediana de 1.8 horas antes de reque- 
rir una recarga. 


1. Ho: р = 1.8. 

2. Н: = 1.8. 

3. а = 0.05. 

4. Estadístico de prueba: variable binomial X con р = > 

5. Cálculos: Al reemplazar cada valor con el símbolo “+” si excede 1.8, con el sím- 


bolo “—” si es menor que 1.8 y descartar las mediciones que sean iguales a 1.8, 
obtenemos la siguiente secuencia 


-+--+--+-- 


para la cual n = 10, x = 3 y n/2 = 5. Por lo tanto, el valor P que se obtiene de la 
tabla A.1 es 


3 
1 1 
P=2P (к= 3 cuando p = 5) = з. (+: 10,5) = 0.3438 > 0.05. 
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6. Decisión: No se rechaza la hipótesis nula y se concluye que la mediana del tiempo 
de funcionamiento no difiere significativamente de 1.8 horas. 2 
También se puede utilizar la prueba de signo para probar la hipótesis пша 4, — Ё, = а, 
para observaciones de pares. Aquí se reemplaza cada diferencia, d,, con un signo más o 
un signo menos, dependiendo de si la diferencia ajustada, d, — 4, es positiva о negativa. 
A lo largo de esta sección hemos asumido que las poblaciones son simétricas. No obs- 
tante, aun si las poblaciones fueran asimétricas, podríamos llevar a cabo el mismo pro- 
cedimiento de prueba, pero las hipótesis se referirían a las medianas de la población en 
vez de a las medias. 


Ejemplo 16.2: Una empresa de taxis intenta decidir si utilizar neumáticos radiales en vez de neumáticos 
regulares con cinturón le serviría para ahorrar combustible. Se equipan 16 automóviles 
con neumáticos radiales y se conducen por un recorrido de prueba establecido. Después 
se equipan los mismos automóviles con los neumáticos regulares con cinturón y se hace 
que los mismos conductores vuelvan a realizar el recorrido de prueba. El consumo de 
gasolina, en kilómetros por litro, se presenta en la tabla 16.1. 

¿Podemos concluir a un nivel de significancia de 0.05 que los automóviles equipa- 
dos con neumáticos radiales ahorran más combustible que los equipados con neumáticos 
regulares con cinturón? 


Tabla 16.1: Datos para el ejemplo 16.2 


Automóvil 1 2 3 4 5 6 7 8 
Neumáticos radiales 42 47 6.6 70 67 45 57 6.0 
Neumáticos con cinturón 4.1 49 62 69 68 44 57 5.8 

Automóvil 9 10 11 12 13 14 15 16 
Neumáticos radiales 74 49 61 52 57 69 68 49 


Neumáticos con cinturón 6.9 49 60 49 53 65 71 4.8 


Solución: Sean р, y [, la mediana de los kilómetros por litro para los automóviles equipados con 
neumáticos radiales y con cinturón, respectivamente. 
1. Ho: ПА — Ё = 0). 
Hi Д1 = i >0. 
а = 0.05. 
Estadístico de prueba: variable binomial X con p = 1/2. 


пром 


Cálculos: después de reemplazar cada diferencia positiva con un símbolo “+” у 
cada diferencia negativa con un símbolo “—”, y después de descartar las dos dife- 
rencias de cero, obtenemos la secuencia 


+++ +++ + + —+ 


para la que n = 14 y x = 11. Si usamos la aproximación de la curva normal, en- 
contramos que 


10.5 —7 


= 1.87, 
y (1410.5)(0.5) 


y entonces 
Р = Р(Х > 11) = P(Z > 1.87) = 0.0307. 
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6. Decisión: Se rechaza H, y se concluye que, en promedio, los neumáticos radiales 
ahorran más combustible. 


La prueba de signo no sólo es uno de los procedimientos no paramétricos más fáciles 
de aplicar, sino que tiene la ventaja adicional de poder aplicarse a datos dicotómicos que 
no se pueden registrar en una escala numérica, pero que se pueden representar mediante 
respuestas positivas y negativas. Por ejemplo, la prueba de signo se aplica en experimen- 
tos donde se registra una respuesta cualitativa como “éxito” o “fracaso”; y en experimentos 
de tipo sensorial donde se registra un signo más o un signo menos, dependiendo de si el 
catador del sabor identifica de manera correcta o incorrecta el ingrediente que se desea. 

Intentaremos hacer comparaciones entre varios de los procedimientos no paramétricos 
y las pruebas paramétricas correspondientes. En el caso de la prueba de signo la compe- 
tencia es, desde luego, la prueba t. Si se toman muestras de una distribución normal, al 
utilizar la prueba т se obtendrá como resultado la potencia más grande de la prueba. Si la 
distribución sólo es simétrica, aunque no sea normal, en términos de potencia se prefiere 
la prueba 7, a menos que la distribución tenga “colas muy pesadas” en comparación 
con la distribución normal. 


16.2 Prueba de rango con signo 


El lector debe notar que la prueba de signo sólo utiliza los signos más y menos de las 
diferencias entre las observaciones y ñ, en el caso de una muestra, о los signos más у 
menos de las diferencias entre los pares de observaciones en el caso de muestras en pa- 
res; no se toma en cuenta la magnitud de esas diferencias. Una prueba que utiliza direc- 
ción y magnitud, propuesta en 1945 por Frank Wilcoxon, ahora se conoce comúnmente 
como prueba de rango con signo de Wilcoxon. 

El analista puede extraer más información de los datos de manera no paramétrica 51 
es razonable aplicar una restricción adicional a la distribución de la que se toman los 
datos. La prueba de rango con signo de Wilcoxon se aplica en el caso de una distribu- 
ción continua simétrica. En esta condición se prueba la hipótesis nula р = [1,. Primero 
restamos (1, de cada valor muestral y descartamos todas las diferencias iguales а cero. 
Las diferencias restantes se ordenan sin importar el signo. Se asigna una categoría de la 
la diferencia absoluta más pequeña, es decir, sin signo, una categoría de 2 a la siguiente 
más pequeña, y así sucesivamente. Cuando el valor absoluto de dos o más diferencias es 
el mismo, se asigna a cada uno el promedio de los rangos que se asignarían si las dife- 
rencias fueran distinguibles. Por ejemplo, si la quinta y la sexta diferencias más peque- 
ñas tienen el mismo valor absoluto, a cada una se le asignaría una categoría de 5.5. Si la 
hipótesis ĵ = [1, es verdadera, el total de los rangos que corresponden a las diferencias 
positivas debería ser casi igual al total de los rangos que corresponden a las diferen- 
cias negativas. Representemos estos totales con w, y w_, respectivamente. Designamos 
el más pequeño de w, y w_ con w. 

Al seleccionar muestras repetidas esperaríamos que w, y w_ y, por lo tanto, w varia- 
rá. De esta manera, consideramos а у, w_ y w como valores de las correspondientes 
variables aleatorias W, W_ y W. La hipótesis nula р = Д se puede rechazar a favor de 
la hipótesis alternativa [4 < [1, sólo si w, es pequeña у w_es grande. De igual manera, la 
hipótesis alternativa Ё > ft, se puede aceptar sólo si w, es grande y w_ es pequeña. Рага 
una alternativa bilateral se puede rechazar H, a favor de H, si w, o w_ y, en consecuencia, 
w son suficientemente pequeñas. Por lo tanto, no importa cuál sea la hipótesis alternativa, 
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cuando el valor del estadístico adecuado W, W о W es suficientemente pequeño, se 
rechaza la hipótesis nula. 


Dos muestras con observaciones en pares 


Con el fin de probar la hipótesis nula de que se toman muestras de dos poblaciones simé- 
tricas continuas con (1, = Ё, para el caso de muestras en pares, se ordenan las diferencias 
de las observaciones en pares sin importar el signo y se procede como en el caso de una 
sola muestra. Los diversos procedimientos de prueba para los casos de una sola muestra 
y de muestras en pares se resumen en la tabla 16.2. 


Tabla 16.2: Prueba de rango con signo 


Ho Hı Calcular 
Ё < Ёо “+ 
Ё = Во Ё > Ho w- 
Ё Ho w 
Ё < fla w+ 
Ё = ро Ё > fla w- 
№ Ф Ёо w 


No es difícil mostrar que siempre que n < 5 y que el nivel de significancia no exce- 
da a 0.05 para una prueba de una cola, o a 0.10 para una prueba de dos colas, todos los 
valores posibles de w,, w_ o w conducirán a la aceptación de la hipótesis nula. Sin em- 
bargo, cuando 5 < п < 30, la tabla A.16 muestra valores críticos aproximados de W, y 
Ү а niveles de significancia iguales a 0.01, 0.025 y 0.05 para una prueba de una cola y 
valores críticos de W a niveles de significancia iguales a 0.02, 0.05 y 0.10 para una prue- 
ba de dos colas. Se rechaza la hipótesis nula si el valor calculado w,, w_ o w es menor o 
igual que el valor tabulado apropiado. Por ejemplo, cuando n = 12, la tabla A.16 indica 
que se requiere un valor de w, < 17 para que la hipótesis alternativa unilateral Йй < Д, 
sea significativa al nivel 0.05. 


Ejemplo 16.3: | Repita el ejemplo 16.1 usando la prueba de rango con signo. 
Solución: 1. Ho: ù= 1.8. 


2. Hi: + 1.8. 
3. a=0.05. 
4 


. Región crítica: Como n = 10, después de descartar la medida que es igual a 1.8, la 
tabla A.16 indica que la región crítica es w < 8. 


5. Cálculos: Al restar 1.8 a cada medida y después ordenar las diferencias sin hacer 
caso del signo, tenemos 


di |-—0.3 0.4 —0.9 —0.5 0.2 —02 —0.3 0.2 —0.6 —0.1 
Rangos | 55 7 0 8 3 з 553 9 1 


Ahora bien, w, = 13 y w = 42, de manera que w = 13, el menor de w, y w. 
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6. Decisión: Como antes, no se rechaza H, y se concluye que la mediana del tiempo 
de operación no difiere significativamente de 1.8 horas. I 


La prueba de rango con signo también se puede utilizar para probar la hipótesis nula 
de que р, — В, = d, En este caso las poblaciones no necesitan ser simétricas. Como 
ocurre con la prueba de signo, restamos d, de cada diferencia, ordenamos las diferencias 
ajustadas sin importar el signo y aplicamos el mismo procedimiento anterior. 


Ejemplo 16.4: | Se afirma que, si se le proporcionan ejemplos de problemas con antelación, un estudian- 


Solución: 


te universitario de último año puede aumentar en al menos 50 puntos su calificación en 
el área de especialidad del examen para ingresar a posgrado. Para probar esta afirmación 
se divide a un grupo de 20 estudiantes del último año en 10 pares, de manera que cada 
par tenga casi la misma calificación promedio durante sus 3 primeros años en la univer- 
sidad. Los ejemplos de problemas y las respuestas se proporcionan al azar a un miembro 
de cada par una semana antes del examen. Las calificaciones del examen se presentan en 
la tabla 16.3. 


Tabla 16.3: Datos para el ejemplo 16.4 


Par 
1 2 3 4 5 6 7 8 9 10 


Con ejemplos de problemas 531 621 663 579 451 660 591 719 543 575 
Sin ejemplos de problemas 509 540 688 502 424 683 568 748 530 524 


A un nivel de significancia de 0.05 pruebe la hipótesis nula de que los ejemplos de 
problemas aumentan las calificaciones en 50 puntos, en comparación con la hipótesis 
alternativa de que aumentan menos de 50 puntos. 

Representemos соп р, y [1, la mediana de las calificaciones de todos los estudiantes que 
resuelven el examen en cuestión con y sin ejemplos de problemas, respectivamente. 
1. Ho: pa = рэ = 50. 
2. Н}: ТЯ = 2 < 50. 
3. а = 0.05. 
4. Región crítica: Como л = 10, la tabla A.16 indica que la región crítica es w, < 11. 
5. Cálculos: 


Rangos 5 6 9 3.5 2 8 3.5 10 7 1 


Se obtiene que w, = 6 + 3.5 + 1 = 10.5. 


6. Decisión: Rechazar H, y concluir que los ejemplos de problemas, en promedio, 
no aumentan las calificaciones del examen para ingresar a posgrado hasta en 
50 puntos. J 


Ejercicios 
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Aproximación normal para muestras grandes 


Cuando п 2 15 la distribución muestral de W, (о W_) se aproxima a la distribución nor- 
mal, con media y varianza dadas por 


_n(n+!) s = п (п + 1)(2п + 1). 
W+ > A 28 24 
Por lo tanto, cuando n excede al valor más grande en la tabla A.16 se utiliza el estadístico 
W,-— 
z= 1+ К+ 
Ow, 


para determinar la región crítica para la prueba. 


Ejercicios 


16.1 Los siguientes datos representan el tiempo, en 
minutos, que un paciente tiene que esperar durante 12 
visitas al consultorio de un médico antes de ser atendido: 
17 15 20 20 32 28 
12 26 25 25 35 24 
Utilice la prueba de signo a un nivel de significancia de 
0.05 para probar la afirmación del médico de que la 
mediana del tiempo de espera de sus pacientes no es 
mayor de 20 minutos. 


16.2 Los siguientes datos representan el número de 
horas de vuelo de entrenamiento que 18 estudiantes 
de piloto reciben de cierto instructor antes de su primer 
vuelo solos: 

9 2 в 14 12 14 12 10 16 

1 9 п B п B 15 B 14 
Con las probabilidades binomiales de la tabla A.1 rea- 
lice una prueba de signo a un nivel de significancia de 
0.02 para probar la afirmación del instructor de que la 
mediana del tiempo de vuelo de entrenamiento que sus 
estudiantes requieren antes de volar solos es de 12 horas. 


16.3 Un inspector de alimentos examina 16 latas de 
cierta marca de jamón para determinar el porcentaje 
de impurezas externas. Se registraron los siguientes datos: 

24 23 31 22 23 12 10 24 

17 11 42 19 17 36 1.6 23 
Utilice una aproximación normal a la distribución bi- 
nomial y realice una prueba de signo a un nivel de sig- 
nificancia de 0.05 para probar la hipótesis nula de que 
la mediana del porcentaje de impurezas en esta marca 
de jamón es de 2.5%, en comparación con la hipótesis 
alternativa de que la mediana del porcentaje de impure- 
zas no es de 2.5%. 


16.4 Un proveedor de pintura acrílica afirma que un 
nuevo aditivo reducirá el tiempo de secado de su pintu- 
ra. Para probar esta afirmación se pintaron 12 paneles 
de madera; la mitad de cada panel se pintó con la pin- 
tura que contiene el aditivo regular y la otra mitad con 


la pintura que contiene el nuevo aditivo. Los tiempos 
de secado, en horas, son los siguientes: 


Tiempo de secado (horas) 


Panel Aditivo nuevo Aditivo regular 
1 6.4 6.6 
2 5.8 5.8 
3 7.4 7.8 
4 5.5 9.7 
5 6.3 6.0 
6 7.8 8.4 
7 8.6 8.8 
8 8.2 8.4 
9 7.0 7.3 

10 4.9 5.8 
11 5.9 5.8 
12 6.5 6.5 


Utilice la prueba de signo a un nivel de 0.05 para pro- 
bar la hipótesis nula de que el nuevo aditivo no dismi- 
nuye el tiempo que tarda en secar la pintura con el 
aditivo regular. 


16.5 Se afirma que una nueva dieta reducirá el peso 
de una persona en 4.5 kilogramos, en promedio, en 
un periodo de dos semanas. Se registran los pesos de 
10 mujeres que siguen esta dieta, antes y después de un 
periodo de dos semanas, y se obtienen los siguientes 
datos: 


Mujer Peso antes Peso después 
1 58.5 60.0 
2 60.3 54.9 
3 61.7 58.1 
4 69.0 62.1 
5 64.0 58.5 
6 62.6 59.9 
7 56.7 54.4 
8 63.6 60.2 
9 68.2 62.3 

10 59.4 58.7 
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Utilice la prueba de signo a un nivel de significancia de 
0.05 para probar la hipótesis de que la dieta reduce la 
mediana del peso en 4.5 kilogramos, en comparación 
con la hipótesis alternativa de que la mediana de la pér- 
dida de peso es menor que 4.5 kilogramos. 


16.6 En un experimento de contaminación atmosférica 
se comparan dos tipos de instrumentos para medir la can- 
tidad de monóxido de azufre en la atmósfera. Se registra- 
ron las siguientes lecturas diarias durante dos semanas: 


Monóxido de azufre 


Día Instrumento A Instrumento B 
1 0.96 0.87 
2 0.82 0.74 
3 0.75 0.63 
4 0.61 0.55 
5 0.89 0.76 
6 0.64 0.70 
7 0.81 0.69 
8 0.68 0.57 
9 0.65 0.53 

10 0.84 0.88 
11 0.59 0.51 
12 0.94 0.79 
13 0.91 0.84 
14 0.77 0.63 


Utilice la aproximación normal a la distribución bino- 
mial y realice una prueba de signo para determinar 51 
los diferentes instrumentos conducen a diferentes re- 
sultados. Utilice un nivel de significancia de 0.05. 


16.7 Las siguientes cifras indican la presión sanguí- 
nea sistólica de 16 corredores antes y después de una 
carrera de ocho kilómetros: 


Corredor Antes Después 
1 158 164 
2 149 158 
3 160 163 
4 155 160 
5 164 172 
6 138 147 
7 163 167 
8 159 169 
9 165 173 

10 145 147 
11 150 156 
12 161 164 
13 132 133 
14 155 161 
15 146 154 
16 159 170 


Utilice una prueba de signo a un nivel de significancia 
de 0.05 para probar la hipótesis nula de que correr ocho 
kilómetros aumenta la mediana de la presión sanguínea 
sistólica en ocho puntos, en comparación con la hipóte- 
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sis alternativa de que el aumento en la mediana es me- 
nor que ocho puntos. 
16.8 Analice los datos del ejercicio 16.1 usando la 
prueba de rango con signo. 
16.9 Analice los datos del ejercicio 16.2 usando la 
prueba de rango con signo. 
16.10 Los pesos de 5 personas, en kilogramos, antes 
de dejar de fumar y cinco semanas después de dejar de 
fumar, son los siguientes: 
Individuo 
1 2 3 4 5 

Antes 66 80 69 52 75 

Después 71 82 68 56 73 
Utilice la prueba de rango con signo para observacio- 
nes en pares y pruebe la hipótesis, a un nivel de signifi- 
cancia de 0.05, de que dejar de fumar no influye en el 
peso de una persona, en comparación con la hipótesis 
alternativa de que al dejar de fumar se aumenta de peso. 
16.11 Repita el ejercicio 16.5 usando la prueba de 
rango con signo. 
16.12 Los siguientes son los números de recetas 
surtidas por dos farmacias en un periodo de 20 días: 


Día Farmacia A Farmacia B 
1 19 17 
2 21 15 
3 15 12 
4 17 12 
5 24 16 
6 12 15 
7 19 11 
8 14 13 
9 20 14 

10 18 21 
11 23 19 
12 21 15 
13 17 11 
14 12 10 
15 16 20 
16 15 12 
17 20 13 
18 18 17 
19 14 16 
20 22 18 


A un nivel de significancia de 0.01 utilice la prueba de 
rango con signo para determinar si las dos farmacias 
surten el mismo número de recetas, “en promedio”, en 
comparación con la hipótesis alternativa de que la far- 
macia A surte más recetas que la farmacia B. 

16.13 Repita el ejercicio 16.7 usando la prueba de 
rango con signo. 

16.14 Repita el ejercicio 16.6 con la prueba de rango 
con signo. 
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16.3 Prueba de la suma de rangos de Wilcoxon 


Como antes indicamos, el procedimiento no paramétrico por lo general es una alternati- 
va adecuada para la prueba de la teoría normal cuando la suposición de normalidad no 
es válida. Cuando nos interesa probar la igualdad de las medias de dos distribuciones 
continuas que evidentemente no son normales, y las muestras son independientes, es de- 
cir, que no hay emparejamiento de observaciones, la prueba de la suma de rangos 
de Wilcoxon o la prueba de dos muestras de Wilcoxon es una alternativa apropiada a 
la prueba г de dos muestras que se describe en el capítulo 10. 

Probaremos la hipótesis пша Н, de que р, = Ñ, en comparación con alguna hipóte- 
sis alternativa adecuada. Primero seleccionamos una muestra aleatoria de cada una de las 
poblaciones. Sea n, el número de observaciones en la muestra más pequeña y n, el núme- 
ro de observaciones en la muestra más grande. Cuando las muestras son de igual tamaño 
n, y n,se pueden asignar de manera aleatoria. Se ordenan las n, + n, observaciones de las 
muestras combinadas en orden ascendente y se sustituye un rango de 1, 2,..., n, + n, para 
cada observación. En el caso de empates (observaciones idénticas), se reemplazan las 
observaciones por la media de los rangos que tendrían las observaciones 51 fueran distin- 
guibles. Por ejemplo, si la séptima y octava observaciones fueran idénticas, se asignaría 
un rango de 7.5 a cada una de las dos observaciones. 

La suma de los rangos que corresponden a las n, observaciones en la muestra más 
pequeña se denota con w,. De manera similar, el valor w, representa la suma de los n, 
rangos que corresponden a la muestra más grande. El total w, + w, depende sólo del 
número de observaciones en las dos muestras y de ninguna manera resulta afectado por 
los resultados del experimento. Por lo tanto, si п, = 3 y n, = 4, entonces w, + w, = 1 + 
2+: + 7 = 28, sin importar los valores numéricos de las observaciones. En general, 


_ (ni +лпо)(пі +12 +1) 

5 , 
Іа suma aritmética de los enteros 1, 2,..., йү Л. Una vez que se determina W,» es más 
fácil calcular w, mediante la fórmula 


Wi + wa 


_ (ni +n2Xnm1 +n2 +1) 
Е 2 

Al elegir muestras repetidas de tamaños л, у n, esperaríamos que w, у, por lo tanto, 
w,, varíen. Así, podríamos considerar a w, y w, como valores de las variables aleatorias 
W, y W, respectivamente. La hipótesis nula р, = ñ, se rechazará a favor de la hipótesis 
alternativa р, < Ñ, sólo si w, es pequeña у w, es grande. De igual manera, la hipóte- 
sis alternativa 4, > ñ, se puede aceptar sólo si w, es grande y w, es pequeña. Para una 
prueba de dos colas podemos rechazar H, a favor de H, si w, es pequeña y w, es grande, 
o si w, es grande y w, es pequeña. En otras palabras, se acepta la hipótesis alternativa 
Ё, < Ё, si w, es suficientemente pequeña; la hipótesis alternativa | > fl, se acepta si w, 
es suficientemente pequeña; y la hipótesis alternativa 41, + Ñ, se acepta si el mínimo de 
w, y w, es tan pequeño como se requiere. En la práctica real por lo general basamos 
nuestra decisión en el valor 


w2 Wi. 


п\(п +1) na(n +1) 
Uy = Мр — ———— о и) =w- —— 
2 2 
del estadístico relacionado U, o U,, o en el valor u del estadístico U, el mínimo de U, y 


U Dichos estadísticos simplifican la construcción de tablas de valores críticos, dado 
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que U, y О, tienen distribuciones muestrales simétricas y toman valores en el intervalo 
de0a nn, tales que u, +u, = nn, 

De las fórmulas para u, y u, vemos que u, será pequeña cuando w, es pequeña, y u, 
será pequeña cuando w, sea pequeña. En consecuencia, la hipótesis nula se rechazará 
siempre que los estadísticos apropiados U ¡» U, о U tomen un valor menor o igual que el 
valor crítico deseado dado en la tabla A.17. Los diversos procedimientos de prueba se 
resumen en la tabla 16.4. 


Tabla 16.4: Prueba de la suma de rangos 


Ho Hı Calcular 
№ < fla uy 
№ = 2 № > la uz 
№ + и 


La tabla A.17 proporciona valores críticos de U, у U, para niveles de significancia 
iguales a 0.001, 0.01, 0.025 y 0.05 para una prueba de una cola, y valores críticos de U 
para niveles de significancia iguales a 0.002, 0.02, 0.05 y 0.10 para una prueba de dos 
colas. 51 el valor observado de и, u, o u es menor o igual que el valor crítico tabulado, 
se rechaza la hipótesis nula al nivel de significancia que se indica en la tabla. Suponga, 
por ejemplo, que deseamos probar la hipótesis nula de que р, = ñ, en comparación 
con la hipótesis alternativa unilateral de que 2 < Ё, а un nivel de significancia de 0.05 
para muestras aleatorias de tamaños n, = 3 y n, = 5, que producen el valor w, = 8. Se 
sigue que 


(3)(4) 

= 8 —-— = 
! 2 
Nuestra prueba de una sola cola se basa en el estadístico 0. Si se usa la tabla A.17, se 
rechaza la hipótesis nula de medias iguales cuando и, < 1. Como и, = 2 no cae en la 
región de rechazo, no se puede rechazar la hipótesis nula. 


Ejemplo 16.5: | Se encontró que el contenido de nicotina de dos marcas de cigarrillos, medido en mili- 


gramos, es el siguiente: 


Marca A | 21 40 63 54 48 3.7 6.1 33 
Marca B | 41 06 31 25 40 62 16 22 19 54 


А un nivel de significancia de 0.05 pruebe la hipótesis de que las medianas del con- 
tenido de nicotina de las dos marcas son iguales, en comparación con la hipótesis alter- 
nativa de que son diferentes. 

Solución: 1. Но: р = ро. 

2. Н |: Ё Ф рә. 

3. а = 0.05. 

4. Región crítica: и < 17 (de la tabla A.17). 
5 


. Cálculos: Las observaciones se acomodan en orden ascendente y se les asignan 
rangos del 1 al 18. 
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Datos originales Rangos | Datos originales Rangos 

0.6 1 4.0 10.5% 
1.6 2 4.0 10.5 
1.9 3 4.1 12 

2.1 4* 48 13* 
2.2 5 5.4 14,5* 
2.5 6 5.4 14.5 
3.1 7 6.1 16* 
3.3 8* 6.2 17 

3.7 9* 6.3 18* 


*Los rangos marcados con asterisco pertenecen a la muestra A. 


Ahora 

wi =4+8+9+10.5 + 13 + 14.5 + 16 + 18 = 93 
y 

1909 
ia LL 08 
2 
Por lo tanto, 
8)(9 10)(11 
и = 93 — 00) = 57, из= 78 — OD 23, 


6. Decisión: no se rechaza la hipótesis nula A, y se concluye que no hay diferencia 
significativa en las medianas del contenido de nicotina en las dos marcas de 
cigarrillos. 


Teoría normal de aproximación para dos muestras 


Cuando л, y n, exceden a 8, la distribución muestral de U, (o U,) se aproxima а la distri- 
bución normal con media y varianza dadas por 


пуп? 2 Nnin2(ni +n +1) 
Mu, = 2 y Со = 12 * 


En consecuencia, cuando n, es mayor que 20, el valor máximo en la tabla A.17, у n, es 
al menos 9, se puede utilizar el estadístico 
Ui — Hu, 

Oy, 


И == 


рага la prueba, con la región crítica que cae ya sea en alguna o en ambas colas de la 
distribución normal estándar, dependiendo de la forma de Н,. 

El uso de la prueba de suma de rangos de Wilcoxon no se restringe a poblaciones no 
normales. Se puede utilizar en vez de la prueba £ de dos muestras cuando las poblaciones 
son normales, aunque la potencia será menor. La prueba de suma de rangos de Wilcoxon 
siempre es superior a la prueba г para poblaciones definitivamente no normales. 
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16.4 Prueba de Kruskal-Wallis 


En los capítulos 13, 14 y 15 la técnica del análisis de varianza resalta como técnica ana- 
lítica para probar la igualdad de k > 2 medias de la población. Sin embargo, el lector 
debería recordar que para que la prueba F sea teóricamente correcta se debe suponer 
normalidad. En esta sección investigamos una alternativa no paramétrica al análisis de 
varianza. 

La prueba de Kruskal-Wallis, también llamada prueba Н de Kruskal-Wallis, es 
una generalización de la prueba de la suma de rangos para el caso de k > 2 muestras. Se 
utiliza para probar la hipótesis nula H, de que k muestras independientes provienen de 
poblaciones idénticas. Presentada en 1952 por W. H. Kruskal y W. A. Wallis, la prueba 
constituye un procedimiento no paramétrico para probar la igualdad de las medias, en el 
análisis de varianza de un factor, cuando el experimentador desea evitar la suposición de 
que las muestras se seleccionaron de poblaciones normales. 

Sea п, (i = 1, 2,..., k) el número de observaciones еп la ¡-ésima muestra. Primero 
combinamos todas las k muestras y acomodamos las n = n, + n, + + + n, observacio- 
nes en orden ascendente, y sustituimos el rango apropiado de 1, 2,..., n para cada obser- 
vación. En el caso de empates (observaciones idénticas), seguimos el procedimiento 
acostumbrado de reemplazar las observaciones por la media de los rangos que tendrían 
las observaciones si fueran distinguibles. La suma de los rangos que corresponde a las n, 
observaciones en la ¡-ésima muestra se denota mediante la variable aleatoria К. Consi- 
deremos ahora el estadístico 


k 
12 R? 
НЕ. NA 1 
a 3(n +1), 


que se aproxima muy bien mediante una distribución chi cuadrada con k — 1 grados de 
libertad, cuando H, es verdadera, siempre y cuando cada muestra conste de al menos 
5 observaciones. El hecho de que Л, el supuesto valor de H, sea grande cuando las mues- 
tras independientes provienen de poblaciones que no son idénticas nos permite establecer 
el siguiente criterio de decisión para probar H; 


Prueba de 
Kruskal-Wallis 


Para probar la hipótesis nula A, de que k muestras independientes provienen de pobla- 
ciones idénticas se calcula 


k 
12 г? 
һ = a 2 1 
mri УЗ т З(п + 1), 


donde г, es el valor supuesto de R, рага і = 1, 2,..., k. Si h cae en la región crítica H > X¿ 
con у = k- 1 grados de libertad, se rechaza H, al nivel de significancia œ; de otra mane- 
ra no se rechaza Н. 


Ejemplo 16.6: | En un experimento para determinar cuál de tres diferentes sistemas de misiles es prefe- 


rible, se mide la tasa de combustión del propulsor. Los datos, después de codificarlos, se 
presentan en la tabla 16.5. Utilice la prueba de Kruskal-Wallis y un nivel de significancia 
de œ = 0.05 para probar la hipótesis de que las tasas de combustión del propulsor son 
iguales para los tres sistemas de misiles. 


16.4 Prueba de Kruskal-Wallis 669 


Solución: 


Tabla 16.5: Tasas de combustión del propulsor 


Sistema de misiles 


1 2 3 
240 16.7 228 | 232 198 18.1 | 184 19.1 17.3 
198 18.9 176 20.2 17.8 | 173 197 18.9 
18.8 19.3 


. Ho: Ш = 0 = (з. 

. Н: las tres medias son diferentes. 

а = 0.05. 

. Región crítica: h > Xĝ os = 5.991, para v = 2 grados de libertad. 


. Cálculos: En la tabla 16.6 convertimos las 19 observaciones a rangos y sumamos 
los rangos para cada sistema de misiles. 


Tabla 16.6: Rangos para las tasas de combustión del propulsor 


Sistema de misiles 


1 2 3 
19 18 7 
1 14.5 11 
17 6 2.5 
14.5 4 2.5 
9.5 16 13 
ri = 61.0 5 9.5 
r2 = 63.5 8 
12 
гз = 65.5 


Ahora, al sustituir п, 5, п, 6, п, 8yr 


61.0, r, = 63.5, r, = 65.5, el esta- 
dístico de prueba H toma el valor 


1 


12 (22 63.52 65.52 


а (19)(20) 5 6 + 8 ) -O20 = 1%. 


. Decisión: Como h = 1.66 no cae en la región crítica h > 5.991, no hay evidencia 


suficiente para rechazar la hipótesis de que las tasas de combustión del propulsor 
son iguales para los tres sistemas de misiles. 
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Ejercicios 


16.15 Un fabricante de cigarrillos afirma que el con- 
tenido de alquitrán de la marca de cigarrillos B es me- 
nor que la de la marca A. Para probar esta afirmación se 
registraron las siguientes medidas del contenido de al- 
quitrán, en miligramos: 


Marca A il 12 9 13 11 14 
Marca B 8 10 7 


Utilice la prueba de suma de rangos con а = 0.05 para 
probar si la afirmación es válida. 


16.16 Para averiguar si un nuevo suero detendrá la 
leucemia se seleccionan nueve pacientes que se en- 
cuentran en una etapa avanzada de la enfermedad. Cinco 
pacientes reciben el tratamiento y cuatro no. Los tiem- 
pos de supervivencia, en años, a partir del momento en 
que comienza el experimento son 


2.153 14 46 0.9 
1905 2.8 3.1 


Con tratamiento 


Sin tratamiento 


Utilice la prueba de suma de rangos a un nivel de signi- 
ficancia de 0.05 para determinar si el suero es eficaz. 


16.17 Los siguientes datos representan el número de 
horas que operan dos diferentes tipos de calculadoras 
científicas de bolsillo antes de que necesiten recargarse. 


Calculadora A| 5.5 5.6 6.3 4.6 5.3 5.0 6.2 5.8 5.1 
Calculadora B| 3.8 4.8 4.3 4.2 4.0 4.9 4.5 5.2 4.5 


Utilice la prueba de la suma de rangos con а = 0.01 
para determinar si la calculadora A opera más tiempo 
que la calculadora B con una carga completa de la batería. 


16.18 Se fabrica un hilo para pesca usando dos proce- 
sos. Para determinar si hay una diferencia en la resis- 
tencia media a la rotura de los hilos, se seleccionan 10 
piezas de cada proceso y después se prueba la resisten- 
cia a la rotura de cada una. Los resultados son los si- 
guientes: 


Proceso 1 10.4 98 115 10.0 9.9 
| 96 109 118 93 107 
са 87 112 98 10.1 108 
95 110 98 105 99 


Utilice la prueba de suma de rangos con а = 0.1 para 
determinar si hay diferencia entre las resistencias me- 
dias a la rotura de los hilos fabricados mediante los dos 
procesos. 


16.19 De una clase de matemáticas de 12 estudiantes 
que tienen las mismas capacidades y utilizan material 
programado se seleccionan cinco al azar para propor- 
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cionarles enseñanza adicional. Los resultados del exa- 
men final son los siguientes: 


Calificación 
Con enseñanza 
adicional 87 69 78 91 80 
Sin enseñanza 
adicional 75 88 64 82 93 79 67 


Utilice la prueba de la suma de rangos con а = 0.05 
para determinar si la enseñanza adicional influye en la 
calificación promedio. 


16.20 Los siguientes datos representan los pesos, en 
kilogramos, del equipaje personal que llevan, en dife- 
rentes vuelos, un jugador de un equipo de beisbol y un 
jugador de un equipo de basquetbol. 


Peso del equipaje (kilogramos) 


Jugador de béisbol | Jugador de basquetbol 
16.3 200 18.6 154 16.3 

18.1 15.0 15.4 17.7 18.1 

15.9 18.6 15.6 18.6 16.8 

14.1 14.5 18.3 127 141 

177 191 174 15.0 13.6 

16.3 13.6 14.8 15.9 163 

132 17.2 16.5 


Utilice la prueba de la suma de rangos con а = 0.05 
para probar la hipótesis nula de que los dos atletas lle- 
van la misma cantidad de equipaje en promedio, en 
comparación con la hipótesis alternativa de que el peso 
promedio del equipaje de los dos atletas es diferente. 


16.21 Los siguientes datos representan los tiempos 
de funcionamiento, en horas, para tres tipos de calcu- 
ladoras científicas de bolsillo, antes de que requieran 
recarga: 


Calculadora 
A | В | C 
49 61 43 55 54 6.2 6.4 6.8 5.6 
46 5.2 58 55 5.2 6.5 6.3 6.6 
4.8 


Utilice la prueba de Kruskal-Wallis a un nivel de signi- 
ficancia de 0.01, para probar la hipótesis de que los 
tiempos de funcionamiento de las tres calculadoras son 
iguales. 


16.22 En el ejercicio 13.6 de la página 519 utilice la 
prueba de Kruskal-Wallis, a un nivel de significancia 
de 0.05, para determinar si los solventes químicos or- 
gánicos difieren de manera significativa en su tasa de 
absorción. 
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16.5 Pruebas de rachas 


Definición 16.1: 


Al aplicar los diversos conceptos estadísticos que se presentan a lo largo de este libro 
siempre asumimos que los datos muestrales se reunieron mediante algún procedimiento 
aleatorio. Las pruebas de rachas, que se basan en el orden en el que se obtienen las 
observaciones muestrales, constituyen una técnica útil para probar la hipótesis nula H, 
de que las observaciones en realidad se obtuvieron al azar. 

Para ilustrar las pruebas de rachas suponga que se encuesta a 12 personas para sa- 
ber si utilizan cierto producto. Se cuestionaría seriamente la supuesta aleatoriedad de la 
muestra si las 12 personas fueran del mismo sexo. Designaremos a un hombre y a una 
mujer con los símbolos H y M, respectivamente, y registraremos los resultados de 
acuerdo con su género en el orden en que ocurren. Una secuencia común para el expe- 
rimento sería 


MM ЕЕЕ М FF MMM M, 
a a НАМ A aa 


donde agrupamos las subsecuencias de símbolos idénticos. Tales agrupamientos se lla- 
man rachas. 


Una racha es una subsecuencia de uno o más símbolos idénticos que representan una 
propiedad común de los datos. 


Sin importar si las mediciones de la muestra representan datos cualitativos o 
cuantitativos, la prueba de rachas divide los datos en dos categorías mutuamente ex- 
cluyentes: hombre o mujer, defectuoso o no defectuoso, cara o cruz, arriba o abajo de 
la mediana, etcétera. En consecuencia, una secuencia siempre estará limitada a dos 
símbolos distintos. Sea n, el número de símbolos asociados con la categoría de menor 
ocurrencia, y n, el número de símbolos que pertenecen a la otra categoría. Entonces, el 
tamaño de la muestra n = n +n, 

Para los n = 12 símbolos en nuestra encuesta tenemos cinco rachas, donde la pri- 
mera incluye dos H, la segunda tres M, y así sucesivamente. Si el número de rachas es 
mayor o menor que el que esperaríamos por el azar, se debe rechazar la hipótesis de que 
la muestra se extrajo al azar. Ciertamente, una muestra que tiene como resultado sólo 
dos corridas, 


HHHHHHHMMMMM 


o la inversa, es muy improbable que provenga de un proceso de selección aleatorio. Este 
resultado indicaría que las primeras siete personas entrevistadas son hombres, seguidos 
de cinco mujeres. Asimismo, si la muestra tiene como resultado el número máximo de 
12 rachas, como en la secuencia alternada 


HMHMHMHMHMHM, 


de nuevo sospecharíamos del orden en que se seleccionaron los individuos para la en- 
cuesta. 

La prueba de rachas para la aleatoriedad se basa en la variable aleatoria V, el número 
total de rachas que suceden en la secuencia completa del experimento. En la tabla A.18 
se dan valores de P(V < v* cuando H, es verdadera) para v* = 2, 3,..., 20 rachas y valores 
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de n, y n, menores o iguales que 10. Los valores P tanto para pruebas de una cola 
como de dos colas se pueden obtener usando estos valores tabulados. 

En la encuesta anterior presentamos un total de 5 M y 7 H. De aquí, con n, = 5, 
n, = 7 y v = 5, en la tabla A.18 observamos que el valor P para una prueba de dos colas es 


P = 2P(V < 5 cuando H, es verdadera) = 0.394 > 0.05. 


Es decir, el valor v = 5 es razonable a un nivel de significancia de 0.05 cuando H, es 
verdadera y, por lo tanto, no tenemos suficiente evidencia para rechazar la hipótesis de 
aleatoriedad de nuestra muestra. 

Cuando el número de rachas es grande, por ejemplo, cuando у = 11 уп, = 5 уп, = 7, 
entonces el valor P en una prueba de dos colas es 


P = 2P(V > 11 cuando H, es verdadera) = 2[1 — P(V < 10 cuando H, es verdadera)] 
= 2(1 - 0.992) = 0.016 < 0.05, 


que nos lleva a rechazar la hipótesis de que los valores de la muestra ocurren al azar. 

La prueba de rachas también sirve para detectar desviaciones en la aleatoriedad de 
una secuencia de mediciones cuantitativas a lo largo del tiempo, ocasionadas por tenden- 
cias O periodos. Al reemplazar cada medición en el orden en que se obtiene, con un 
símbolo más si caen por arriba de la mediana, o con un símbolo menos si caen por debajo 
de la mediana, y omitiendo todas las mediciones que son exactamente iguales a la me- 
diana, se genera una secuencia de signos de más y menos que se somete a prueba para 
verificar su aleatoriedad, como se ilustra en el siguiente ejemplo. 


Ejemplo 16.7: | Una máquina vierte adelgazador de pintura acrílica en un contenedor. ¿Si se mide el 


Solución: 


contenido de los siguientes 15 contenedores y los resultados son 3.6, 3.9, 4.1, 3.6, 3.8, 
3.7, 3.4, 4.0, 3.8, 4.1, 3.9, 4.0, 3.8, 4.2 y 4.1 litros, diría que la cantidad de adelgazador 
de pintura que despacha la máquina varía de forma aleatoria? Utilice un nivel de signifi- 
cancia de 0.1. 

1. Н; La secuencia es aleatoria. 
Н: La secuencia no es aleatoria. 
а = 0.1. 


Estadístico de prueba: У, número total de rachas. 


E 


Cálculos: Para la muestra dada encontramos x = 3.9. Al reemplazar cada medi- 
ción por el símbolo “+”, si cae por arriba de 3.9, por el signo “—” si cae por de- 
bajo de 3.9, y si se omiten las dos mediciones que son iguales a 3.9, obtenemos la 
secuencia 


-+----+-+t+-++ 


para la que n, = 6, n, = 7 y v = 8. Por lo tanto, de la tabla A.18, el valor P calcu- 
lado es 


P = 2P(V > 8 cuando H, es verdadera) 
= 2[1 — P(V < 8 cuando H, es verdadera)] = 2(0.5) = 1. 


6. Decisión: No se rechaza la hipótesis de que la secuencia de mediciones varía de 
forma aleatoria. J 
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La prueba de rachas, aunque menos poderosa, también se utiliza como una alterna- 
tiva a la prueba de dos muestras de Wilcoxon para probar la afirmación de que dos muestras 
aleatorias provienen de poblaciones que tienen la misma distribución y, por lo tanto, 
medias iguales. Si las poblaciones son simétricas, el rechazo de la afirmación de distri- 
buciones iguales es equivalente a aceptar la hipótesis alternativa de que las medias no 
son iguales. Para hacer la prueba primero se combinan las observaciones de ambas 
muestras y se acomodan en orden ascendente. Ahora se asigna la letra A a cada observa- 
ción tomada de una de las poblaciones, y la letra B a cada observación de la otra población, 
generando así una secuencia que consta de los símbolos A y B. Si las observaciones de 
una población se vinculan con las observaciones de la otra población, la secuencia 
de símbolos A y B que se genera no será única y, en consecuencia, es poco probable que 
el número de rachas sea único. Los procedimientos para romper los empates por lo ge- 
neral dan como resultado tediosos cálculos adicionales, por lo que siempre que ocurran 
dichas situaciones sería preferible aplicar la prueba de la suma de rangos de Wilcoxon. 

Con el fin de ilustrar el uso de las rachas al probar la igualdad de medias, considere 
los tiempos de supervivencia de los pacientes de leucemia del ejercicio 16.16 de la pági- 
na 670, para los que tenemos 


05 09 14 19 21 28 31 46 53 
B А A B A B B A A 


que resultan en v = 6 rachas. Si las dos poblaciones simétricas tienen medias iguales, las 
observaciones de las dos muestras estarán entremezcladas, lo cual dará como resultado 
muchas rachas. Sin embargo, si las medias de la población son significativamente dife- 
rentes, esperaríamos que la mayoría de las observaciones de una de las dos muestras 
fueran más pequeñas que las de la otra muestra. En el caso extremo de que las poblacio- 
nes no se traslapen, obtendríamos una secuencia de la forma 


АААААВВВВ о ВВВВААААА 


y en cualquier caso sólo habría dos rachas. En consecuencia, la hipótesis de medias de la 
población iguales se rechazará a un nivel de significancia œ sólo cuando v sea suficien- 
temente pequeña, de modo que 


Р = P(V < v cuando H, es verdadera) < а, 


lo que implica una prueba de una cola. 
Si regresamos a los datos del ejercicio 16.16 de la página 670, para los que n, = 4, 
n, = 5 y v= 6, en la tabla A.18 encontramos que 


Р = P(V < 6 cuando H, es verdadera) = 0.786 > 0.05 


y, por lo tanto, no se rechaza la hipótesis nula de medias iguales. De aquí concluimos que 
el nuevo suero no prolonga la vida, ya que no detiene la leucemia. 

Cuando n, y n, aumentan en tamaño, la distribución de muestreo de V se aproxima 
a la distribución normal con media y varianza dadas por 


2n1n2 2 2пуп2(2піпо — nı — n2) 


<BR ias | 
ч пу +п2 и (пі +п2)2 (пу + пә — 1) 


En consecuencia, cuando n, у n, son ambos mayores que 10, se puede utilizar el estadístico 


V — Шу 
Oy 


Z = 


con el fin de establecer la región crítica para la prueba de rachas. 
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16.6 Límites de tolerancia 


En el capítulo 9 se analizaron los límites de tolerancia para una distribución normal de 
mediciones. En esta sección consideramos un método para construir intervalos de toleran- 
cia que sean independientes de la forma de la distribución subyacente. Como se podría 
sospechar, para un grado de confianza razonable serán considerablemente más grandes 
que los que se construyen cuando se supone normalidad, y el tamaño de la muestra que se 
requiere es por lo general muy grande. Los límites de tolerancia no paramétricos se esta- 
blecen en términos de las observaciones más grande y más pequeña en nuestra muestra. 


Límites de 
tolerancia 
bilaterales 


Para cualquier distribución de mediciones los límites de tolerancia bilaterales son indi- 
cados por las observaciones más grande y más pequeña en una muestra de tamaño п, 
donde и se determina de manera que se asegure, con 100(1 — y)% de confianza, que al 
menos la proporción 1 — о de la distribución está incluida entre los extremos de la muestra. 


La tabla A.19 proporciona los tamaños de la muestra requeridos para los valores 
seleccionados de y y 1 — а. Por ejemplo, cuando “y = 0.01 y 1—о = 0.95, debemos selec- 
cionar una muestra aleatoria de tamaño n = 130 para tener 99% de confianza en que al 
menos 95% de la distribución de mediciones está incluido entre los extremos de la muestra. 

En vez de determinar un tamaño muestral n tal que una proporción específica de 
mediciones esté contenida entre los extremos de la muestra, en muchos procesos indus- 
triales es deseable determinar un tamaño de la muestra tal que una proporción fija de la 
población caiga por debajo de la observación más grande (o por arriba de la más pequeña) 
de la muestra. Tales límites se denominan límites de tolerancia unilaterales. 


Límites de 
tolerancia 
unilaterales 


Para cualquier distribución de mediciones un límite de tolerancia unilateral se determina 
mediante la observación más pequeña (o más grande) en una muestra de tamaño n, don- 
de п se determina de manera que se pueda asegurar соп 100(1 — 7)% de confianza que al 
menos la proporción 1 — а de la distribución excederá a la observación más pequeña 
(menor que la mayor) de la muestra. 


La tabla A.20 muestra los tamaños de la muestra requeridos, correspondientes a 
valores seleccionados de y y 1 — а. De aquí, cuando y = 0.05 y 1— о = 0.70, debemos 
elegir una muestra de tamaño n = 9 para tener 95% de confianza en que 70% de nuestra 
distribución de mediciones excederá la observación más pequeña de la muestra. 


16.7 Coeficiente de correlación de rango 


En el capítulo 11 utilizamos el coeficiente de correlación muestral r para medir el coefi- 
ciente de correlación poblacional p, la relación lineal entre dos variables continuas X y 
Y. Si los rangos 1, 2,..., n se asignan a las observaciones x en orden de magnitud y de 
manera similar a las observaciones y, y si estos rangos se sustituyen después con los 
valores numéricos reales en la fórmula para el coeficiente de correlación del capítulo 11, 
obtenemos el equivalente no paramétrico del coeficiente de correlación convencional. 
Un coeficiente de correlación calculado de esta forma se conoce como coeficiente de 
correlación de rangos de Spearman y se denota con г. Cuando no hay empates entre 
ambos conjuntos de mediciones la fórmula para r, se reduce a una expresión mucho más 
simple que incluye las diferencias d, entre los rangos asignados a los n pares de x y y que 
establecemos ahora. 
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Coeficiente Una medida no paramétrica de la asociación entre dos variables X y Y es dada por el 
de correlación coeficiente de correlación de rango 
de rangos 


6 n 
Жыш = TA GR а?, 
п(п? — 1) 2, d 


donde d, es la diferencia entre los rangos asignados a x, y y, y n es el número de pares de 
datos. 


En la práctica, la fórmula anterior también se usa cuando hay empates entre las ob- 
servaciones x о y. Los rangos para observaciones empatadas se asignan de la misma 
manera que en la prueba de rango con signo al promediar los rangos que se habrían 
asignado si las observaciones fueran distinguibles. 

El valor de r рог lo general se acercará al valor que se obtiene al calcular r con base 
en mediciones numéricas y se interpreta de forma muy similar. Como antes, el valor de 
г, irá de —1 a +1. Un valor de +1 o —1 indica una asociación perfecta entre X y Y; el 
signo más ocurre para rangos idénticos y el signo menos para rangos inversos. Cuando 
r, se acerca a cero, se concluye que las variables no están correlacionadas. 


Ejemplo 16.8: | Las cifras que se listan en la tabla 16.7, publicadas por la Comisión Federal de Comer- 
cio, muestran los miligramos de alquitrán y nicotina que se encontraron en 10 marcas de 
cigarrillos. Calcule el coeficiente de correlación de rangos para medir el grado de rela- 
ción entre el contenido de alquitrán y de nicotina en cigarrillos. 


Tabla 16.7: Contenidos de alquitrán y nicotina 


Marca de cigarrillos Contenido de alquitrán Contenido de nicotina 


Viceroy 14 0.9 
Marlboro 17 1.1 
Chesterfield 28 1.6 
Kool 17 1.3 
Kent 16 1.0 
Raleigh 13 0.8 
Old Gold 24 1.5 
Philip Morris 25 1.4 
Oasis 18 1.2 
Players 31 2.0 


Solución: Sean X y Y los contenidos de alquitrán y nicotina, respectivamente. Primero asignamos 
rangos a cada conjunto de medidas, con el rango de 1 asignado al número más bajo en 
cada conjunto, el rango de 2 al segundo número más bajo en cada conjunto, y así suce- 
sivamente, hasta que se asigna el rango 10 al número más grande. La tabla 16.8 muestra 
los rangos individuales de las mediciones y las diferencias en rangos para los 10 pares 
de observaciones. 
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Tabla 16.8: Rangos para los contenidos de alquitrán y nicotina 


Marca de cigarrillos x; Yi di 
Viceroy 2.0 2.0 0.0 
Marlboro 4.5 4.0 0:5 
Chesterfield 9.0 9.0 0.0 
Kool 4.5 6.0 —1.5 
Kent 3.0 3.0 0.0 
Raleigh 1.0 1.0 0.0 
Old Gold 7.0 8.0 —1.0 
Philip Morris 8.0 7.0 1.0 
Oasis 6.0 5.0 1.0 
Players 10.0 10.0 0.0 


Al sustituir en la fórmula para r , encontramos que 


_,_ (6650) _ 
кейе Ad 


lo que indica una correlación positiva alta entre las cantidades de alquitrán y de nicotina 
que se encuentra en los cigarrillos. JJ 

Hay algunas ventajas al usar г en vez de r. Por ejemplo, ya no suponemos que la 
relación fundamental entre X y Y es lineal, por lo tanto, cuando los datos poseen una 
relación curvilínea distinta, el coeficiente de correlación de rangos probablemente será 
más confiable que la medida convencional. Una segunda ventaja del uso del coeficiente 
de correlación de rangos es el hecho de que no se hacen suposiciones de normalidad 
respecto a las distribuciones de X y Y. Quizá la mayor ventaja ocurre cuando no somos 
capaces de hacer mediciones numéricas significativas y, sin embargo, se pueden esta- 
blecer rangos. Tal es el caso, por ejemplo, cuando diferentes jueces clasifican a un 
grupo de individuos de acuerdo con algún atributo. El coeficiente de correlación de 
rangos se puede utilizar en esta situación como una medida de la consistencia de los dos 
jueces. 

Para probar la hipótesis de que p = 0 utilizando un coeficiente de correlación de 
rangos, se necesita considerar la distribución muestral de los valores r, con base en la 
suposición de que no hay correlación. En la tabla A.21 aparecen valores críticos calcula- 
dos para о = 0.05, 0.025, 0.01 y 0.005. La elaboración de esta tabla es similar a la tabla 
de valores críticos para la distribución t, excepto por la columna izquierda, que ahora 
proporciona el número de pares de observaciones en vez de los grados de libertad. Como 
la distribución de los valores r es simétrica alrededor de cero cuando p = 0, el valor г, 
que deja una área de Q а la izquierda es igual al negativo del valor г que deja una área 
de са la derecha. Para una hipótesis alternativa bilateral la región crítica de tamaño о 
cae igualmente en las dos colas de la distribución. Para una prueba en la que la hipótesis 
alternativa es negativa, la región crítica está completamente en la cola izquierda de la 
distribución y, cuando la hipótesis alternativa es positiva, la región crítica se coloca por 
completo en la cola derecha. 


Ejercicios 
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Ejemplo 16.9: | Remítase al ejemplo 16.8 y pruebe la hipótesis de que la correlación entre la cantidad de 


alquitrán y nicotina encontrada en los cigarrillos es cero en comparación con la hipótesis 
alternativa de que es mayor que cero. Utilice un nivel de significancia de 0.01. 


Solución: 1. Но: p=0. 
2. Hi: р> 0. 
3. а = 0.01. 
4. Región crítica: r, > 0.745, de la tabla A.21. 
5. Cálculos: Del ejemplo 16.8, г, = 0.967. 
6. Decisión: Se rechaza H, y se concluye que hay una correlación significativa entre 
la cantidad de alquitrán y nicotina que se encuentra en los cigarrillos. JJ 
Con base en la suposición de que no hay correlación, se puede demostrar que la 
distribución de los valores rs se aproxima a una distribución normal, con una media igual 
а cero y una desviación estándar de 1//n—1 conforme aumenta п. En consecuencia, 
cuando п excede a los valores dados en la tabla A.21 se puede probar si existe una corre- 
lación significativa calculando 
5 = 0 1 
т = = ran = 
* 34 INn=1 ` 
y comparando con los valores críticos de la distribución normal estándar que se presen- 
tan en la tabla А.З. 
Ejercicios 


16.23 Con el fin de estimar la proporción de votantes 
que favorecen a cierto candidato para alcalde, se selec- 
ciona una muestra aleatoria de 15 adultos que viven en 
una pequeña ciudad. También se le pregunta a cada in- 
dividuo si se graduó de la universidad. Al denotar con 
S y N las respuestas “sí” y “no”, respectivamente, a la 
pregunta sobre la escolaridad, se obtuvo la siguiente 
secuencia: 


NNNNYYNYYNYNNNN 


Utilice la prueba de rachas a un nivel de significancia 
de 0.1 para determinar si la secuencia apoya la afirma- 
ción de que la muestra se seleccionó al azar. 


16.24 Se utiliza un proceso de plateado para cubrir 
cierto tipo de charola de servicio. Cuando el proceso 
está bajo control el espesor de la plata sobre la charola 
variará de forma aleatoria siguiendo una distribución 
normal con una media de 0.02 milímetros y una des- 
viación estándar de 0.005 milímetros. Suponga que las 
siguientes 12 charolas examinadas muestran los si- 
guientes espesores de plata: 0.019, 0.021, 0.020, 0.019, 
0.020, 0.018, 0.023, 0.021, 0.024, 0.022, 0.023, 0.022. 
Utilice la prueba de rachas para determinar si las fluc- 


tuaciones en el espesor de una charola a otra son alea- 
torias. Utilice œ = 0.05. 


16.25 Use la prueba de rachas a un nivel de 0.01 para 
probar si hay una diferencia en el tiempo promedio de 
funcionamiento para las dos calculadoras del ejercicio 
16.17 de la página 670. 


16.26 En una línea de producción industrial los ar- 
tículos se inspeccionan de forma periódica en busca de 
defectos. La siguiente es una secuencia de artículos defec- 
tuosos, D, y no defectuosos, N, producidos por esta 
línea: 


DDNNNDNNDDNNNN 
NDDDNNDNNNNDND 


Utilice la teoría de muestras grandes para la prueba de 
rachas a un nivel de significancia de 0.05 para determi- 
nar si los artículos defectuosos ocurren al azar. 


16.27 Suponga que las mediciones del ejercicio 1.14 
de la página 30 se registraron en renglones sucesivos de 
izquierda a derecha conforme se reunieron. Utilice la 
prueba de rachas con а = 0.05 para probar la hipótesis 
de que los datos representan una secuencia aleatoria. 
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16.28 ¿Qué tan grande debe ser una muestra para te- 
ner 95% de confianza en que al menos 85% de la distri- 
bución de medidas se incluye entre los extremos de la 
muestra? 


16.29 ¿Cuál es la probabilidad de que el rango de una 
muestra aleatoria de tamaño 24 incluya al menos a 90% 
de la población? 


16.30 ¿Qué tan grande debe ser una muestra para te- 
ner 99% de confianza en que al menos 80% de la pobla- 
ción será menor que la observación más grande de la 
muestra? 


16.31 ¿Cuál es la probabilidad de que al menos 95% 
de una población exceda al valor más pequeño en una 
muestra aleatoria de tamaño n = 135? 


16.32 En la siguiente tabla se presentan las califi- 
caciones registradas de 10 estudiantes en un examen de 
medio curso y las del examen final en un curso 
de cálculo: 


Examen de Examen 
Estudiante medio curso final 
L.S.A. 84 73 
W.P.B. 98 63 
R.W.K. 91 87 
ЛЕТ. 72 66 
КТ. 86 78 
D.L.P. 93 78 
B.L.P. 80 91 
D.W.M. 0 0 
M.N.M. 92 88 
R.H.S. 87 77 


a) Calcule el coeficiente de correlación de rangos. 

b) Pruebe la hipótesis nula de que p = 0 en compara- 
ción con la hipótesis alternativa de que p > 0. Uti- 
lice œ = 0.025. 


16.33 Refiérase a los datos del ejercicio 11.1 de la 
página 398 y 

a) calcule el coeficiente de correlación de rangos; 

b) aun nivel de significancia de 0.05 pruebe la hipó- 
tesis nula de que p = О, en comparación con la 
hipótesis alternativa de que р + 0. Compare sus 
resultados con los obtenidos en el ejercicio 11.44 
de la página 435. 


16.34 Calcule el coeficiente de correlación de ran- 
gos para la precipitación pluvial diaria y la cantidad 
de partículas eliminadas en el ejercicio 11.13 de la pá- 
gina 400. 


16.35 Refiérase a los datos del ejercicio 11.47 de la 
página 436 respecto al peso y tamaño de tórax de los 
bebés, y 
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a) calcule el coeficiente de correlación de rangos; 

b) aun nivel de significancia de 0.025, pruebe la hi- 
pótesis de que p = 0 en comparación con la hipó- 
tesis alternativa de que p > 0. 


16.36 Un grupo de consumidores prueba la calidad 
general de nueve marcas de hornos de microondas. Los 
rangos asignados por el grupo y los precios de venta al 
menudeo sugeridos son los siguientes: 


Clasificación Precio 
Fabricante del grupo sugerido ($) 
A 6 480 
B 9 395 
C 2 575 
D 8 550 
E 5 510 
Е 1 545 
G 7 400 
H 4 465 
1 3 420 


¿Existe una relación significativa entre la calidad y el 
precio de un horno de microondas? Utilice un nivel de 
significancia de 0.05. 


16.37 En un desfile de regreso a clases dos jueces ca- 
lifican ocho carros alegóricos en el siguiente orden: 


Carro alegórico 
1 2 3 4 5 6 7 8 


Juez A 5 8 4 3 6 2 7 1 
Juez B 7 5 4 2 8 1 6 3 


a) Calcule el coeficiente de correlación de rangos. 

b) Pruebe la hipótesis nula de que p = 0 en compara- 
ción con la hipótesis alternativa de que p > 0. Use 
о = 0.05. 


16.38 En el artículo titulado “Risky Assumptions” de 
Paul Slovic, Baruch Fischoff y Sarah Lichtenstein, pu- 
blicado en Psychology Today (junio de 1980), miem- 
bros de la Liga de Mujeres Votantes y expertos 
profesionalmente implicados en la evaluación de ries- 
gos clasificaron el riesgo de muerte, en Estados Uni- 
dos, de realizar 30 actividades y utilizar tecnologías. 
Las puntuaciones se presentan en la tabla 16.9. 
a) Calcule el coeficiente de correlación de rangos. 
b) Pruebe la hipótesis nula de cero correlación entre 
las clasificaciones de la Liga de Mujeres Votantes 
y de los expertos en comparación con la hipótesis 
alternativa de que la correlación no es igual a cero. 
Utilice un nivel de significancia de 0.05. 


Ejercicios de repaso 


679 


Tabla 16.9: Rango de datos para el ejercicio 16.38 


Riesgo de la actividad Riesgo de la actividad 

o tecnología Votantes Expertos | o tecnología Votantes Expertos 
Energía nuclear 1 20 Vehículos de motor 2 1 
Armas de fuego 3 4 Tabaquismo 4 2 
Motocicletas 5 6 Bebidas alcohólicas 6 3 
Aviación privada 7 12 Trabajo policiaco 8 17 
Pesticidas 9 8 Cirugía 10 5 
Bombero 11 18 Construcción grande 12 13 
Cacería 13 23 Latas de aerosol 14 26 
Montañismo 15 29 Bicicletas 16 15 
Aviación comercial 17 16 Energía eléctrica 18 9 
Natación 19 10 Anticonceptivos 20 11 
Esquí 21 30 Rayos X 22 7 
Futbol americano 23 27 Ferrocarriles 24 19 
Conservadores de alimentos 25 14 Colorantes de alimentos 26 21 
Podadoras 27 28 Antibióticos 28 24 
Electrodomésticos 29 22 Vacunas 30 25 


Ejercicios de repaso 


16.39 Un estudio de una empresa química compara 
las propiedades de desecación de dos diferentes polí- 
meros. Se utilizaron 10 lodos diferentes y se permitió 
que ambos polímeros secaran cada lodo. El secado li- 
bre se midió en mL/min. 


Tipo de lodo Polímero A Polímero B 
1 12.7 12.0 
2 14.6 15.0 
3 18.6 19.2 
4 17.5 17.3 
5 11.8 12.2 
6 16.9 16.6 
7 19.9 20.1 
8 17.6 17.6 
9 15.6 16.0 

10 16.0 16.1 


a) Utilice la prueba de signos a un nivel de 0.05 para 
probar la hipótesis nula de que el polímero A tiene 
la misma mediana de secado que el polímero B. 

b) Utilice la prueba de rangos con signo para probar 
la hipótesis del inciso a. 


16.40 En el ejercicio de repaso 13.45 de la página 
555 use la prueba de Kruskal-Wallis, a un nivel de sig- 
nificancia de 0.05, para determinar si los análisis quí- 
micos realizados por los cuatro laboratorios producen, 
en promedio, los mismos resultados. 


16.41 Use los datos del ejercicio 13.14 de la página 
530 para ver si la cantidad mediana de pérdida de nitró- 
geno en la transpiración difiere para los tres niveles de 
proteína dietética. 


Capítulo 17 


Control estadístico de la calidad 


17.1 Introducción 


La idea de usar técnicas de muestreo y análisis estadístico en un entorno de producción 
tuvo sus comienzos en la década de 1920. El objetivo de este concepto tan exitoso es 
reducir de manera sistemática la variabilidad y el aislamiento asociados con las fuentes 
de dificultades durante la producción. En 1924 Walter A. Shewhart, de la empresa Bell 
Telephone Laboratories, desarrolló el concepto de gráfica de control. Sin embargo, fue 
hasta la Segunda Guerra Mundial cuando se generalizó el uso de este tipo de gráficas de- 
bido a la importancia que durante ese periodo tuvo el mantenimiento de la calidad en los 
procesos de producción. En las décadas de 1950 y 1960 el desarrollo del control de calidad 
y el área general de seguridad de la calidad crecieron con rapidez, en particular con el 
surgimiento del programa espacial en Estados Unidos. En Japón hubo un amplio y exitoso 
uso del control de calidad gracias a los esfuerzos de W. Edwards Deming, quien trabajó 
como consultor en Japón después de la Segunda Guerra Mundial. El control de calidad ha 
sido, y es, un elemento importante en el desarrollo de la industria y la economía de Japón. 

El control de calidad está recibiendo cada vez más atención como una herramienta 
de administración en la cual se observan y evalúan las características importantes de un 
producto en comparación con algún tipo de estándar. Los diversos procedimientos en el 
control de calidad implican un uso considerable de los procedimientos de muestreo y los 
principios estadísticos expuestos en capítulos anteriores. Los principales usuarios del 
control de calidad son, por supuesto, las corporaciones industriales. Es evidente que un 
programa eficaz de control de calidad mejora la calidad del artículo que se produce y au- 
menta las utilidades. Esto es particularmente cierto en la actualidad, pues los productos 
se fabrican en volúmenes altos. Antes de que surgiera el movimiento hacia los métodos 
de control de calidad, a menudo ésta se veía afectada debido a la falta de eficiencia, lo 
cual, por supuesto, incrementaba los costos. 


La gráfica de control 


El objetivo de una gráfica de control es determinar si el desempeño de un proceso se 
mantiene en un nivel aceptable de calidad. Se espera, desde luego, que cualquier proceso 
experimente una variabilidad natural, es decir, una variabilidad debida esencialmente a 
fuentes de variación poco importantes e incontrolables. Por otro lado, un proceso puede 
experimentar formas más severas de variabilidad en mediciones de desempeño funda- 
mentales. 
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Estas fuentes de variabilidad pueden surgir de uno de varios tipos de “causas asig- 
nables” no aleatorias, como errores del operador o indicadores mal ajustados en una 
máquina. Un proceso que opera en dicho estado se denomina fuera de control. Se dice 
que un proceso que sólo experimenta variaciones aleatorias está en control estadístico. 
Desde luego, un proceso de producción exitoso puede operar en un estado de control 
durante un periodo largo. Se supone que durante este periodo el proceso elabora un 
producto aceptable. Sin embargo, podría ocurrir un “cambio” gradual o repentino que 
requiera detección. 

El propósito de una gráfica de control es que funcione como un dispositivo para 
detectar el estado no aleatorio o fuera de control de un proceso. La gráfica de control 
suele adoptar la forma que se indica en la figura 17.1. Cuando ocurre un cambio en el 
proceso es importante detectarlo con rapidez, de manera que se pueda corregir el pro- 
blema. Evidentemente, si el cambio no se detecta de inmediato, se producirán muchos 
artículos defectuosos o que no cumplen las especificaciones, lo cual dará como resultado 
un desperdicio significativo y un incremento en los costos. 


Característica 


1 2 3 4 5 6 7 8 9 10 
Tiempo 


Figura 17.1: Gráfica de control típica. 


Se deben considerar ciertos tipos de características de la calidad y se deben tomar 
muestras de las unidades del proceso a medida que pasa el tiempo. Digamos, por ejem- 
plo, que la característica de un cojinete de motor es la circunferencia. La línea central 
representa el valor promedio de la característica cuando el proceso está bajo control. 
Los puntos que se indican en la figura representarían los resultados de, digamos, los 
promedios muestrales de tal característica, con muestras tomadas en diferentes momen- 
tos. Los límites de control superior e inferior se eligen de tal manera que se esperaría 
que, si el proceso está bajo control, todos los puntos muestrales queden cubiertos por 
estos límites. Como resultado, la forma general de los puntos graficados a lo largo del 
tiempo determina si se concluye que el proceso está bajo control. La evidencia de que 
está “dentro de control” se obtiene de un patrón aleatorio de puntos con todos los valores 
graficados dentro de los límites de control. Cuando un punto cae fuera de los límites de 
control, se considera como evidencia de que un proceso está fuera de control, en cuyo 
caso se sugiere una búsqueda para determinar la causa. Además, un patrón no aleatorio 
de puntos se debe considerar sospechoso y, evidentemente, un indicador de que es nece- 
sario investigar para encontrar la medida correctiva adecuada. 
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17.2 Naturaleza de los límites de control 


Las ideas fundamentales en las que se basan las gráficas de control son similares en 
estructura a la prueba de hipótesis. Los límites de control se establecen para controlar la 
probabilidad de cometer el error de concluir que el proceso está fuera de control, cuando 
de hecho no lo está. Esto corresponde a la probabilidad de cometer un error tipo I si 
probáramos la hipótesis nula de que el proceso está bajo control. Por otro lado, debemos 
estar atentos al error del segundo tipo, es decir, el de no encontrar el proceso fuera de 
control cuando de hecho sí lo está (error tipo П). De esta manera, la elección de los lími- 
tes de control es similar a la elección de una región crítica. 

Сото en el caso de la prueba de hipótesis, el tamaño de la muestra en cada punto es 
importante. La elección del tamaño de la muestra depende en gran medida de la sensibi- 
lidad o potencia de detección del estado fuera de control. En esta aplicación, el concepto 
de potencia es muy similar al de la situación de la prueba de hipótesis. Queda claro que 
cuanto más grande sea la muestra en cada periodo, más rápida será la detección de un 
proceso fuera de control. En cierto sentido los límites de control en realidad definen lo 
que el usuario considera como estar bajo control. En otras palabras, la amplitud dada 
por los límites de control debe depender en cierto sentido de la variabilidad del proceso. 
Como resultado, el cálculo de los límites de control dependerá de manera natural de los 
datos que se tomen de los resultados del proceso. De esta forma, cualquier aplicación del 
control de calidad debe comenzar con el cálculo de una muestra o conjunto de muestras 
preliminar, que establecerá tanto la línea central como los límites del control de calidad. 


17.3 Objetivos de la gráfica de control 


Un propósito evidente de la gráfica de control es la vigilancia del proceso, o sea deter- 
minar si es o no necesario realizar cambios. Además, la constante y sistemática obten- 
ción de datos a menudo permite a la administración evaluar la capacidad del proceso. 
Es evidente que, si una sola característica de desempeño es importante, el muestreo 
y la estimación continuos de la media y la desviación estándar de esa característi- 
ca de desempeño ofrecen la actualización de lo que el proceso puede hacer en términos 
de desempeño promedio y variación aleatoria. Esto es valioso incluso cuando el proceso 
permanece bajo control durante periodos largos. La estructura sistemática y formal de 
la gráfica de control a menudo puede prevenir una reacción desmesurada ante cambios 
que representen sólo fluctuaciones aleatorias. Obviamente, en muchas situaciones los 
cambios realizados por una reacción desmesurada pueden crear graves problemas que 
son difíciles de resolver. 

Las características de calidad de las gráficas de control por lo general caen en dos 
categorías: variables y atributos. Como resultado, los tipos de gráficas de control con 
frecuencia tienen las mismas clasificaciones. En el caso de la gráfica de los tipos de va- 
riables, la característica suele ser una medida sobre un continuo, como el diámetro o el 
peso. En el caso de la gráfica de atributos, lo que refleja la característica es si el producto 
individual se ajusta a las especificaciones (51 está o no defectuoso). Las aplicaciones 
para estas dos situaciones distintas son evidentes. 

En el caso de la gráfica de variables se debe ejercer control sobre la tendencia cen- 
tral y la variabilidad. Lo que a un analista de control de calidad le debe preocupar es si 
existe o no, en promedio, un cambio en los valores de la característica de desempeño. 
Además, siempre habrá interés por saber si algún cambio en las condiciones del proceso 
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provoca que disminuya la precisión, es decir, que aumente la variabilidad. Para manejar 
estos dos conceptos es esencial utilizar gráficas de control separadas. La tendencia cen- 
tral es controlada por la gráfica X, donde las medias de muestras relativamente pequeñas 
se dibujan en la gráfica de control. La variabilidad alrededor de la media se controla 
mediante el rango en la muestra, o la desviación estándar de la muestra. En el caso de 
muestreo de atributos a menudo la cantidad que se grafica es la proporción de artículos 
defectuosos de una muestra. En la siguiente sección analizamos el desarrollo de gráficas 
de control para los tipos de variables de las características del desempeño. 


17.4 Gráficas de control para variables 


LCI = H — Za/2 


Un ejemplo es una forma relativamente sencilla de explicar los rudimentos de la gráfica 
X para variables. Suponga que en un proceso de fabricación de cierta parte de un motor 
se deben utilizar las gráficas de control de calidad. Suponga también que la media del 
proceso es и = 50 mm y que la desviación estándar es с = 0.01 mm. Imagine que se 
toman muestras en grupos de 5 cada hora y que los valores de la media muestral X se 
registran y grafican como en la figura 17.2. Los límites para las gráficas X se basan en 
la desviación estándar de la variable aleatoria X. Sabemos, a partir de lo expuesto en el 
capítulo 8, que para el promedio de observaciones independientes en una muestra de 
tamaño л, 
Oz = т 

donde des la desviación estándar de una observación individual. Los límites de control 
están diseñados para dar como resultado una pequeña probabilidad de que un valor dado 
de Xesté fuera de los límites dado que, en realidad, el proceso está bajo control, es decir, 
и = 50. Si recurrimos al teorema del límite central, tendremos que, en las condiciones 
en las que el proceso está controlado, 


X ~N (б, 5). 


mE 


Como resultado, 100(1 — а)% de los valores X cae dentro de los límites cuando el pro- 
ceso está bajo control si utilizamos los límites 


с с 
—= = 50 — Za j2 (0.0045), LCS = р + 202 = 
yn yn 
Aquí LCI y LCS representan el límite de control inferior y el límite de control superior, 
respectivamente. Con frecuencia las gráficas X se basan en límites denominados “tres- 
sigma”, refiriéndonos, por supuesto, а т „ = 3 y a límites que se convierten en 


= 50 + 22 (0.0045). 


T 


En nuestro ejemplo, los límites superior e inferior son 


и +3 


LCI = 50 — 3(0.0045) = 49.9865, LCS = 50 + 3(0.0045) = 50.0135. 


Por consiguiente, si vemos la estructura de los límites Зс desde el punto de vista de la 
prueba de hipótesis para un punto muestral dado, encontraremos que hay una probabilidad 
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Figura 17.2: Los límites de control Зо para el ejemplo de la parte del motor. 


de 0.0026 de que el valor X caiga fuera de los límites de control, dado que el proceso está 
bajo control. Ésta es la probabilidad de que el analista determine de manera errónea que 
el proceso está fuera de control (véase la tabla A.3). 

El ejemplo anterior no sólo ilustra la gráfica X para las variables, también propor- 
ciona al lector una idea general de la naturaleza de las gráficas de control. La línea central 
por lo general refleja el valor ideal de un parámetro importante. Los límites de control 
se establecen a partir del conocimiento de las propiedades de muestreo del estadístico 
que estima el parámetro en cuestión. Con mucha frecuencia implican un múltiplo de la 
desviación estándar del estadístico. Se ha generalizado el uso de límites Зо. En el caso 
de la gráfica X que se presenta aquí, el teorema del límite central brinda al usuario una 
buena aproximación de la probabilidad de determinar de forma errónea que el proceso 
está fuera de control. En general, sin embargo, es probable que el usuario no confíe en la 
normalidad del estadístico sobre la línea central. Lo anterior podría dar como resultado 
que no se conozca la probabilidad exacta de cometer un “error tipo Г”. A pesar de esto 
se ha vuelto muy común utilizar los límites ko. Aunque los límites 3d se utilizan am- 
pliamente, en ocasiones el usuario utilizará otro método. Cuando es importante detectar 
de forma rápida una situación fuera de control podría ser apropiado utilizar un múltiplo 
menor de с. Si se toman en cuenta los costos de producción, cabe señalar que permi- 
tir que un proceso continúe funcionando fuera de control, incluso por periodos cortos, 
puede resultar más costoso que invertir en la investigación y corrección de las causas de 
la pérdida del control en el proceso. En este caso es evidente que los límites apropiados 
son los límites de control que son más estrictos que los límites 30. 


Subgrupos racionales 


Los valores de la muestra que se utilizan para el control de calidad se dividen en subgru- 
pos, en los que una muestra representa un subgrupo. Como antes indicamos, el orden en 
el tiempo de producción es en realidad una base natural para la selección de los subgru- 
pos. Podríamos considerar el esfuerzo de control de calidad de manera muy simple como 
1) muestreo, 2) detección de un estado fuera de control y 3) búsqueda de las causas 
atribuibles que puedan ocurrir con el tiempo. Tal vez parezca que la selección de la base 
para estos grupos muestrales es muy sencilla, pero la elección de estos subgrupos de in- 
formación muestral podría tener un efecto importante en el éxito del programa de control 
de calidad. Estos subgrupos con frecuencia se denominan subgrupos racionales. En 
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general, si el analista está interesado en detectar un cambio de ubicación, se considera 
que los subgrupos se deben elegir de manera que la variabilidad dentro del subgrupo sea 
pequeña, y de manera que haya mayores posibilidades de detectar las causas atribuibles, 
si se presentaran. Así, deseamos elegir los subgrupos de forma que se maximice la va- 
riabilidad entre subgrupos. Por ejemplo, un método razonable es elegir unidades en un 
subgrupo que se producen de forma cercana en el tiempo. Por otro lado, las gráficas de 
control a menudo se utilizan para controlar la variabilidad, en cuyo caso el estadístico 
de desempeño es la variabilidad dentro de la muestra. Por consiguiente, es más impor- 
tante elegir los subgrupos racionales para maximizar la variabilidad dentro de la mues- 
tra. En este caso las observaciones en los subgrupos se deberían comportar más como 
una muestra aleatoria y la variabilidad dentro de las muestras necesita ser una descrip- 
ción de la variabilidad del proceso. 

Es importante señalar que las gráficas de control sobre la variabilidad se deben 
establecer antes de construir gráficas sobre el centro de ubicación (digamos, gráficas X). 
Cualquier gráfica de control sobre el centro de ubicación en realidad dependerá de la va- 
riabilidad. Por ejemplo, vimos un ejemplo de la gráfica de tendencia central y ésta depende 
de с. En las secciones que siguen se analizará un estimado de са partir de los datos. 


Gráfica X con parámetros estimados 


Con anterioridad ilustramos las nociones de la gráfica X que usa el teorema del límite 
central y emplea valores conocidos de la media y desviación estándar del proceso. Como 
al principio se indicó, se utilizan los límites de control 


LCI = р гор LCS = ш + 20/2 


с с 

ут үт 
y un valor X que cae fuera de estos límites se considera evidencia de un cambio еп la 
media и, у, por lo tanto, de la posibilidad de que el proceso esté fuera de control. 

En muchas situaciones prácticas no es razonable suponer que conocemos u y с. 
Como resultado, se deben proporcionar estimados de los datos que se obtienen cuando 
el proceso está bajo control. Por lo general los estimados se determinan durante un pe- 
riodo en el que se reúne información antecedente о de inicio. Se elige una base para 
subgrupos racionales y se reúnen los datos con muestras de tamaño n en cada subgrupo. 
Los tamaños de la muestra por lo general son pequeños, digamos, 4, 5 о 6, y se toman 
k muestras, con k al menos igual a 20. Durante este periodo, en el que se supone que el 
proceso está bajo control, el usuario establece los estimados de u y сер los que se basa 
la gráfica de control. La información importante reunida durante este periodo incluye 
las medias muestrales en el subgrupo, la media general y el rango de la muestra en cada 
subgrupo. En los siguientes párrafos señalaremos cómo se utiliza esta información para 
producir la gráfica de control. 

Una parte de la información muestral de estas k muestras toma la forma X,, X»,..., 
Хк, donde la variable aleatoria X; es el promedio de los valores en la ¡-ésima muestra. 
Evidentemente, el promedio global es la variable aleatoria 


= ДА. 
Х 2 


Éste es el estimador adecuado de la media del proceso y, por consiguiente, es la línea 
central en la gráfica de control X. En aplicaciones de control de calidad a menudo es 
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conveniente estimar са partir de la información relacionada con los rangos en las mues- 
tras, en vez de las desviaciones estándar muestrales. Definamos 


Ri = X máx, iT X mín, i 


como el rango para los datos en la i-ésima muestra. Aquí X,. Y Xmm; SON, respectiva- 
mente, la observación más grande y la más pequeña en la muestra. El estimado apro- 


piado de с es una función del rango promedio 


1 k 
RETI Re 


donde d, es una constante que depende del tamaño de la muestra. Los valores de d, se 
muestran en la tabla A.22. 

El uso del rango para producir un estimado de с tiene sus raíces en aplicaciones si- 
milares a la del control de calidad, en particular debido a que, en la época en que aún era 
muy difícil lograr cálculos precisos, el rango era muy fácil de calcular en comparación 
con otros estimados de variabilidad. La suposición de normalidad de las observaciones 
individuales está implícita en la gráfica X. Por supuesto, la existencia del teorema del 
límite central es ciertamente útil a este respecto. Bajo la suposición de normalidad, usa- 
mos una variable aleatoria llamada rango relativo dada por 


W=-—. 
с 


De la cual resulta que los momentos de W son funciones simples del tamaño de la mues- 
tra n (véase la referencia de Montgomery, 2000b, en la bibliografía). El valor esperado 
de W a menudo se denomina d, Así, al tomar el valor esperado de la W anterior, 


a 
т 2> 


la cual facilita la comprensión del fundamento para el estimado 6 = R/d,. Se sabe bien 
que el método del rango produce un estimador eficiente de с en muestras hasta cierto 
punto pequeñas. Esto hace que el estimador sea particularmente atractivo en aplica- 
ciones de control de calidad, ya que los tamaños de la muestra en los subgrupos por lo 
general son pequeños. El uso del método del rango para la estimación de с tiene como 
resultado gráficas de control con los siguientes parámetros: 

LCS = X + = И línea central = Х, LCI = X — 2 


аут di 


Al definir la cantidad 


688 


Capítulo 17 Control estadístico de la calidad 


tenemos que 
LCS =Х+АЁ, LCI =Х-А›Ё. 


Para simplificar la estructura el usuario de las gráficas X a menudo encuentra valores 
tabulados de A,. En la tabla A.22 se incluyen valores de A, para varios tamaños de la 
muestra. 


Gráficas R para control de variación 


Hasta aquí todos los ejemplos y detalles tuvieron que ver con el intento del analista de 
control de calidad de detectar condiciones fuera de control producidas por un cambio en 
la media. Los límites de control se basan en la distribución de la variable aleatoria X y 
dependen de la suposición de normalidad de las observaciones individuales. Es impor- 
tante que el control se aplique tanto a la variabilidad como al centro de ubicación. De 
hecho, muchos expertos consideran que el control de la variabilidad de la característica 
del desempeño es más importante y que es necesario establecerlo antes de considerar el 
centro de ubicación. La variabilidad del proceso se puede controlar usando gráficas del 
rango muestral. Una gráfica de los rangos muestrales a lo largo del tiempo se denomina 
gráfica R. Se puede utilizar la misma estructura general, como en el caso de la gráfica X, 
donde Res la línea central y los límites de control dependen de que se estime la desvia- 
ción estándar de la variable aleatoria R. Por lo tanto, como en el caso de la gráfica X, se 
establecen límites 30 donde “30” implica 30. La cantidad о, se debe estimar a partir 
de los datos, tal como se estima 0. 

El estimado de с„ la desviación estándar, también se basa en la distribución del 
rango relativo 


ү = =. 
g 


La desviación estándar de W es una función conocida del tamaño de la muestra y por lo 
general se denota por d,. Esto da como resultado, 


Ор = са. 
Ahora podemos reemplazar O por б = R/d,, y de esta forma el estimador de с, es 


>, _Ё% 
к = d 


Por consiguiente, las cantidades que definen la gráfica R son 
LCS =RD4, — líneacentral=R, LCI = RD}, 


donde las constantes D, y D, (que dependen sólo de n) son 


d3 d3 
D, = 1 +3 —, D3 = 1—3 —. 
4 + d 3 ЕА 


Las constantes D, у D, se encuentran tabuladas en Іа tabla A.22. 
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Se controla un proceso de fabricación de partes componentes para misiles, donde la ca- 
racterística de desempeño es la resistencia a la tensión, en libras por pulgada cuadrada. 
Se toman muestras de tamaño 5 cada hora y se reportan 25 muestras. Los datos se mues- 


tran en la tabla 17.1. 


Tabla 17.1: Información muestral de los datos de resistencia a la tensión 


Número de muestra Observaciones Xi Ri 
1 1515 1518 1512 1498 1511 1510.8 20 
2 1504 1511 1507 1499 1502 1504.6 12 
3 1517 1513 1504 1521 1520 1515.0 17 
4 1497 1503 1510 1508 1502 1504.0 13 
5 1507 1502 1497 1509 1512 1505.4 15 
6 1519 1522 1523 1517 1511 1518.4 12 
7 1498 1497 1507 1511 1508 1504.2 14 
8 1511 1518 1507 1503 1509 1509.6 15 
9 1506 1503 1498 1508 1506 1504.2 10 
10 1503 1506 1511 1501 1500 1504.2 11 
11 1499 1503 1507 1503 1501 1502.6 8 
12 1507 1503 1502 1500 1501 1502.6 7 
13 1500 1506 1501 1498 1507 1502.4 9 
14 1501 1509 1503 1508 1503 1504.8 8 
15 1507 1508 1502 1509 1501 1505.4 8 
16 1511 1509 1503 1510 1507 1508.0 8 
17 1508 1511 1513 1509 1506 1509.4 7 
18 1508 1509 1512 1515 1519 1512.6 11 
19 1520 1517 1519 1522 1516 1518.8 6 
20 1506 1511 1517 1516 1508 1511.6 11 
21 1500 1498 1503 1504 1508 1502.6 10 
22 1511 1514 1509 1508 1506 1509.6 8 
23 1505 1508 1500 1509 1503 1505.0 9 
24 1501 1498 1505 1502 1505 1502.2 7 
25 1509 1511 1507 1500 1499 1505.2 12 


Como antes indicamos, es importante comenzar por establecer las condiciones de 


variabilidad “bajo control”. La línea central calculada para la gráfica R es 


E 1 25 
R= 52% = 10.72. 


En la tabla A.22 encontramos que para n = 5, D,=0 y D,= 2.114. Como resultado, los 


límites de control para la gráfica R son 


LCI = RD; = (10.720) = 0, 


LCS = Ёр, = (10.72)(2.114) = 22.6621. 
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En la figura 17.3 se muestra la gráfica R. Ninguno de los rangos graficados cae fuera 
de los límites de control. Como resultado, no hay nada que indique la existencia de una 
situación fuera de control. 


Rango 


ГС! =0 
0 


Muestra 


Figura 17.3: Gráfica R para el ejemplo de resistencia a la tensión. 


Ahora se puede construir la gráfica X para las lecturas de la resistencia a la tensión. 
La línea central es 


= 


25 
Х = УХ, = 1507.328. 
i=1 


N 


5 


En la tabla A.22 encontramos que, para muestras de tamaño 5, A, = 0.577. De esta 
forma, los límites de control son 


LCS = Х + АЁ = 1507.328 + (0.577)(10.72) = 1513.5134, 
LCI = X — А6 = 1507.328 — (0.577)(10.72) = 1501.1426. 


En la figura 17.4 se muestra la gráfica X. Como el lector puede observar, tres valores 
caen fuera de los límites de control, lo cual es una señal de que no se deberían usar los 
límites de control de X para el control de calidad de la línea. 


Más comentarios acerca de las gráficas de control para variables 


Un proceso podría parecer estar bajo control y, de hecho, permanecer así durante un 
periodo largo. ¿Esto significaría necesariamente que el proceso está funcionando de 
manera exitosa? Un proceso que opera bajo control es simplemente aquel en el que la 
media y la variabilidad del proceso permanecen estables, indicando, aparentemente, que 
no han ocurrido cambios graves. “Bajo control” implica que el proceso permanece con- 
sistente con variabilidad natural. Las gráficas de control de calidad pueden verse como 
un método en el que la variabilidad natural inherente rige la amplitud de los límites de 
control. Sin embargo, no determinan hasta qué punto un proceso bajo control satisface 
las especificaciones predeterminadas que requiere el proceso. Las especificaciones son 
límites que establece el consumidor. Si la variabilidad natural del proceso actual es mayor 
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Figura 17.4: Gráfica X para el ejemplo de resistencia a la tensión. 


que la que determinan las especificaciones, aunque el proceso permanezca estable y 
esté bajo control, con demasiada frecuencia producirá artículos que no cumplirán las 
especificaciones. 

Aludimos a la suposición de normalidad para las observaciones individuales en una 
gráfica de control de variables. Para la gráfica X, si las observaciones individuales son 
normales, el estadístico Xes normal. Como resultado, el analista de control de calidad en 
este caso tiene control sobre la probabilidad de un error tipo I. Si las X individuales no 
son normales, Xes aproximadamente normal, por lo tanto, existe un control aproximado 
sobre la probabilidad de un error tipo І para el caso en el que se conoce с. Sin embargo, 
utilizar o no el método del rango para estimar la desviación estándar también depende 
de la suposición de normalidad. Estudios respecto a la robustez de la gráfica X para des- 
viaciones de la normalidad indican que, para las muestras de tamaño k > 4, la gráfica X 
da como resultado un riesgo œ cercano al anunciado (véase el trabajo de Montgomery, 
2000b, y Schilling y Nelson, 1976, en la bibliografía). Indicamos antes que la aproxi- 
mación +k0, a la gráfica R es una cuestión de conveniencia y tradición. Incluso si la 
distribución de observaciones individuales es normal, la distribución de R no es normal. 
De hecho, la distribución de R no es ni siquiera simétrica. Los límites de control simé- 
tricos de +ко, sólo proporcionan una aproximación al riesgo о y, en algunos casos, la 
aproximación no es particularmente buena. 


Elección del tamaño de la muestra (función característica de operación) 
en el caso de la gráfica X 


Los científicos e ingenieros que manejan el control de calidad a menudo se refieren a 
los factores que influyen en el diseño de la gráfica de control. Los componentes que 
determinan el diseño de la gráfica incluyen el tamaño de la muestra que se toma en cada 
subgrupo, la amplitud de los límites de control y la frecuencia del muestreo. Todos estos 
factores dependen en gran medida de consideraciones económicas y prácticas. La fre- 
cuencia de muestreo evidentemente depende del costo del muestreo y del costo en el que 
se incurre si el proceso continúa fuera de control durante un periodo largo. Estos mismos 
factores afectan la amplitud de la región “bajo control”. El costo asociado con la inves- 
tigación y la búsqueda de las causas atribuibles de la pérdida de control repercute en 
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la amplitud de la región y en la frecuencia de muestreo. Se ha puesto mucha atención en 
el diseño óptimo de gráficas de control, por lo que aquí no se darán mayores detalles. Se 
remite al lector al trabajo de Montgomery (2000b), que se cita en la bibliografía, para un 
excelente recuento histórico de gran parte de esta investigación. 

La elección del tamaño de la muestra y la frecuencia de muestreo implican equili- 
brar los recursos disponibles para estos dos esfuerzos. En muchos casos es probable que 
el analista necesite hacer cambios en la estrategia hasta lograr el equilibrio adecuado. El 
analista siempre debe estar consciente de que, si el costo de producción de artículos no 
adecuados es grande, la estrategia adecuada sería una alta frecuencia de muestreo con un 
tamaño de la muestra relativamente pequeño. 

Al elegir el tamaño de una muestra hay que tomar en cuenta muchos factores. En la 
ilustración y el análisis enfatizamos el uso de n = 4, 5 o 6. Estos valores se consideran 
relativamente pequeños para problemas generales en inferencia estadística, pero serían 
tamaños de muestra apropiados para el control de calidad. Una justificación, por su- 
puesto, es que el control de calidad es un proceso continuo y los resultados producidos 
por una muestra o un conjunto de unidades serán seguidos por resultados de muchas 
más. Así, el tamaño de la muestra “eficaz” de todo el esfuerzo de control de calidad es 
muchas veces mayor que el tamaño que se utiliza en un subgrupo. Por lo general se con- 
sidera más efectivo tomar muestras frecuentemente con un tamaño muestral pequeño. 

El analista puede utilizar el concepto de potencia de una prueba para obtener infor- 
mación de la eficacia del tamaño de la muestra elegido. Esto es especialmente impor- 
tante, ya que por lo general se utilizan muestras de tamaño pequeño en cada subgrupo. 
Remítase a los capítulos 10 y 13 para un análisis de la potencia de pruebas formales 
sobre las medias y el análisis de varianza. Aunque en el control de calidad en realidad 
no se realizan pruebas formales de hipótesis, se puede tratar la información como si la 
estrategia en cada subgrupo fuera la de probar una hipótesis, ya sea sobre la media de la 
población и o sobre la desviación estándar с. Es de interés la probabilidad de detectar 
una condición fuera de control para una muestra dada y, quizá más importante, el nú- 
mero esperado de corridas requeridas para detectarla. La probabilidad de detectar una 
condición fuera de control específica corresponde a la potencia de una prueba. No es 
nuestra intención demostrar el desarrollo de la potencia para todos los tipos de gráficas 
de control que aquí se presentan, más bien, lo que deseamos es mostrar el desarrollo de 
la gráfica X y presentar los resultados de potencia para la gráfica R. 

Considere la gráfica X cuando se conoce el valor de с. Suponga que el estado bajo 
control tiene y = 4, Un estudio del papel que desempeña el tamaño de la muestra del 
subgrupo equivale a investigar el riesgo 8, es decir, la probabilidad de que un valor X 
permanezca dentro de los límites de control cuando realmente ha ocurrido un cambio en 
la media. Suponga que la forma que toma el cambio es 


H = Ш + го. 


De nuevo, al utilizar la normalidad de Xtenemos 
B=P(LCI <X <LCS | р= o +10). 


Para el caso de límites ko, 


k 
LC =w=- y LCS= pt Z. 


yn 
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Como resultado, si denotamos con Z la variable aleatoria normal estándar 


A E г< (се) 
=p зз ы. AP 
e a _ ) 


Observe el papel que desempeñan n, r y k en la expresión para el riesgo 8. La probabili- 
dad de no detectar un cambio específico, como se esperaba, aumenta claramente con un 
incremento en К. 8 disminuye con un aumento en г; la magnitud del cambio, y disminuye 
con un incremento en el tamaño de la muestra, л. 

Se debería enfatizar que la expresión anterior da como resultado el riesgo 8 (proba- 
bilidad de un error tipo II) para el caso de una sola muestra. Por ejemplo, suponga que, 
en el caso de una muestra de tamaño 4, ocurre un cambio de с en la media. La proba- 
bilidad de detectar el cambio (potencia) en la primera muestra después del cambio es, 
suponiendo límites 30: 


1-8 =1 — [P(Z < 1) – P(Z < —5)] = 0.1587. 
Por otro lado, la probabilidad de detectar un cambio de 20 es 
1-8 =1 — [P(Z < —1) — P(Z < —7)] = 0.8413. 


Los resultados anteriores ilustran una muy modesta probabilidad de detectar un 
cambio de magnitud су una alta probabilidad de detectar un cambio de magnitud 20. 
En la figura 17.5 se observa la imagen completa de cómo se desempeñan los límites de 
control 30 para la gráfica X que aquí se describe. En lugar de graficar las funciones 
de potencia se presenta una gráfica de 3 contra г, donde el cambio en la media tiene una 
magnitud ro. Por supuesto, los tamaños de la muestra de n = 4, 5, 6 dan como resultado 
una pequeña probabilidad de detectar un cambio de 1.00 o incluso 1.50 en la primera 
muestra después del cambio. 

Pero si el muestreo se realiza con frecuencia, la probabilidad podría no ser tan im- 
portante como el número promedio o esperado de corridas que se requiere antes de de- 
tectar un cambio. Una detección rápida es importante y ciertamente posible, aunque no 
hay muchas probabilidades de lograrlo en la primera muestra. Resulta que las gráficas 
X con estas muestras pequeñas conducirán a una detección relativamente rápida. Si 8 
es la probabilidad de no detectar un cambio en la primera muestra después del cambio, 
entonces la probabilidad de detectarlo en la muestra s-ésima después de que ocurre es, 
suponiendo que las muestras son independientes: 


PB =(1-818" 7. 


El lector debe reconocer que ésta es una aplicación de la distribución geométrica. El 
valor promedio o esperado del número de muestras que se requieren para la detección es 


1 

sB1(1-8B)= —. 
0 а — 8 
Por consiguiente, el número esperado de muestras que se requieren para detectar el cam- 
bio en la media es el recíproco de la potencia, es decir, la probabilidad de detección en 
la primera muestra después del cambio. 


оо 


s=1 
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Figura 17.5: Curvas características de operación para la gráfica X соп límites Зо. Aquí, 
@ es el error de probabilidad tipo П en la primera muestra después de que ocurre un 
cambio en la media de ro. 


Ejemplo 17.1: | En cierto esfuerzo por controlar la calidad es importante que el analista detecte con rapi- 
dez los cambios en la media de +0 utilizando una gráfica de control Зс con una muestra 
de tamaño n = 4. El número esperado de muestras que se requieren después del cambio 
para detectar el estado fuera de control podría ser útil en la evaluación del procedimien- 
to de control de calidad. 

En la figura 17.5, paran = 4 y r = 1, se puede ver que 8 ~ 0.84. Si utilizamos s para 
denotar el número de muestras que se requieren para detectar el cambio, la media de s es 


1 1 
Е@ = т=в = 016 = 25 


De esta manera, se requieren siete subgrupos, en promedio, antes de detectar un cambio 
de +0. J 


Elección del tamaño de la muestra para la gráfica R 


La curva CO de la gráfica R se muestra en la figura 17.6. Como la gráfica R se utiliza para 
controlar la desviación estándar del proceso, y la desviación estándar después de que 
el proceso se sale de control, el riesgo (8 se grafica como una función de la desviación 
estándar bajo control, O, La última desviación estándar se denotará con O. Sea 

og 


A==—. 
00 


Para varios tamaños muestrales se grafica 8 contra A. 
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Figura 17.6: Curva característica operativa para las gráficas R con límites de 30. 


Gráficas X y S para variables 


Para el estudiante de estadística es natural anticipar el uso de la varianza muestral en la 
gráfica X y en una gráfica para el control de la variabilidad. El rango es un estimador 
eficiente de с, pero esta eficiencia disminuye a medida que aumenta el tamaño de la 
muestra. Para una n tan grande como 10 se debe utilizar el tan conocido estadístico 


S= | ix, 2) 


n=1. 
i=1 


en la gráfica de control, tanto para la media como para la variabilidad. El lector debe 
recordar que en el capítulo 9 se expuso que S? es un estimador no sesgado de o°, pero 
que 5 no es по sesgado para с. Para evitar sesgos se acostumbra corregir $ en las aplica- 
ciones de la gráfica de control. Sabemos, en general, que 


Е (5) # с. 


En el caso еп que las X, sean independientes y estén distribuidas de forma normal con 
media u y varianza 0°, 


2 ү г(п/2) 
==) Ги — 0/2] 


y Г(-) se refiere a la función gamma (véase el capítulo 6). Por ejemplo, para n = 5, с, = 
(3/8) 27. Además, la varianza del estimador 5 es 


E(S) = сс, donde C4 = ( 


Var(S) = o° (1 — с2). 
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Establecimos las propiedades de S que nos permitirán escribir límites de control para X 

y S. Para construir una estructura adecuada comenzamos por suponer que conocemos с. 

Después presentamos la estimación de са partir de un conjunto de muestras preliminar. 
Al graficar el estadístico S, los parámetros evidentes de la gráfica de control son 


LCS = c40 + 304/1 — с2, línea central = c40, LCI = c40 — 304/1 — c2. 


Como de costumbre, los límites de control se definen de manera más sucinta utilizando 
constantes tabuladas. Sean 


B; = сд – 3 1 с2, В = са + 3 1 – с2, 
entonces, tenemos 
LCS = Bso, línea central = c40, LCI = Bso. 


En la tabla A.22 se encuentran tabulados los valores de В; y В, рага varios tamaños 
muestrales. 

Ahora, por supuesto, los límites de control anteriores sirven como base para el desa- 
rrollo de los parámetros de control de calidad en la situación que con más frecuencia se 
observa en la práctica, a saber, en la que se desconoce т. Debemos suponer una vez más 
que para producir un estimado de с durante lo que se supone es un periodo “bajo con- 
trol” se toma un conjunto de muestras base O muestras preliminares. Las desviaciones 
estándar de las muestras 5 Йй 8... S, se obtienen a partir de muestras que son, cada una, 
de tamaño n. A menudo se utiliza un estimador no sesgado del tipo 


S 1 
& A C4 


para с. Aquí, desde luego, $, el valor promedio de la desviación estándar muestral en la 
muestra preliminar, es la línea central lógica en la gráfica de control para el control de 
la variabilidad. Los límites de control superior e inferior son estimadores no sesgados 
de los límites de control adecuados para el caso en el que se conoce с. Como 


8) 
C4 


el estadístico Ses una línea central apropiada (como un estimador no sesgado de c,0) y 


las cantidades 
_ $ а 5 
5 3—41 сі y 5 +3=4/1-c 
Сд Сд 


son los límites de control 3с inferior y superior apropiados, respectivamente. Como 
resultado, la línea central y los límites para la gráfica S de control de variabilidad son 


LCI = B4, línea central = 5, LCS = BaS, 


donde 


3 3 
Вз =1——\/1—с2, В, =1+ 24/1 c2. 
Сд C4 
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las constantes B, y B, aparecen en la tabla А.22. 

Ahora podemos escribir los parámetros de la gráfica Xcorrespondiente que implican 
el uso de la desviación estándar muestral. Supongamos que podemos disponer de S y X 
de la muestra base preliminar. La línea central continúa siendo X y los límites 30 son 
simplemente de la forma X + 30/ х/т, donde д es un estimador insesgado. Simplemente 
proporcionamos Š / с , como un estimador de о, y de esta forma tenemos 


ЕСТЕ Аз $, línea central = Х, LCS = X + А3 $, 


donde 3 


суп 


En la tabla A.22 aparece la constante A, para varios tamaños de la muestra. 


Аз = 


Ejemplo 17.2: | Se producen contenedores mediante un proceso en el que el volumen de éstos es some- 
tido a un control de calidad. Se utilizaron 25 muestras de tamaño 5 para establecer los 
parámetros de control de calidad. En la tabla 17.2 se documenta la información de estas 
muestras. 

En la tabla A.22 se observa que B, = 0, B, = 2.089 y A, = 1.427. Como resultado, 
los límites de control para X son dados por 


LCS = X + 4; Š = 62.3771, LCI = X — А3 Š = 62.2741, 
y los límites de control para la gráfica $ son 
LCI <=B5S=0, LCS = B45 = 0.0754. 


Las figuras 17.7 y 17.8 muestran las gráficas de control para este ejemplo, X y S, 
respectivamente. En las gráficas se representa la información de las 25 muestras en el 
conjunto de datos preliminar. Al parecer, el control se establece después de las primeras 
muestras. J 
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Como indicamos al principio de este capítulo, muchas aplicaciones industriales de con- 
trol de calidad requieren que la característica de calidad indique sólo que el artículo “se 
ajusta”. En otras palabras, no hay una medición continua que sea crucial para el des- 
empeño del artículo. Una ilustración evidente de este tipo de muestreo, denominado 
muestreo por atributos, es el desempeño de una bombilla que funciona o no de manera 
satisfactoria. El artículo está o no defectuoso. Las piezas metálicas fabricadas pueden 
tener deformaciones; los contenedores de una línea de producción pueden tener fugas. 
En ambos casos un artículo defectuoso impide su uso por parte del consumidor. La grá- 
fica de control estándar para esta situación es la gráfica p, o gráfica para la fracción de 
defectuosos. Como se podría esperar, la distribución de probabilidad que interviene es 
la distribución binomial. Se remite al lector al capítulo 5 para información básica de la 
distribución binomial. 
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Tabla 17.2: Volumen de contenedores para 25 muestras en una muestra preliminar 
(en centímetros cúbicos) 


Muestra Observaciones Xi Si 


1 62.255 62.301 62.289 62.189 62.311 62.269 0.0495 
2 62.187 62.225 62.337 62.297 62.307 62.271 0.0622 
3 62.421 62.377 62.257 62.295 62.222 62.314 0.0829 
4 62.301 62.315 62.293 62.317 62.409 62.327 0.0469 
5 62.400 62.375 62.295 62.272 62.372 62.343 0.0558 
6 
7 
8 


62.372 62.275 62.315 62.372 62.302 62.327 0.0434 

62.297 62.303 62.337 62.392 62.344 62.335 0.0381 

62.325 62.362 62.351 62.371 62.397 62.361 0.0264 

9 62.327 62.297 62.318 62.342 62.318 62.320 0.0163 
10 62.297 62.325 62.303 62.307 62.333 62.313 0.0153 
11 62.315 62.366 62.308 62.318 62.319 62.325 0.0232 
12 62.297 62.322 62.344 62.342 62.313 62.324 0.0198 
13 62.375 62.287 62.362 62.319 62.382 62.345 0.0406 
14 62.317 62.321 62.297 62.372 62.319 62.325 0.0279 
15 62.299 62.307 62.383 62.341 62.394 62.345 0.0431 
16 62.308 62.319 62.344 62.319 62.378 62.334 0.0281 
17 62.319 62.357 62.277 62315 62.295 62.313 0.0300 
18 62.333 62.362 62.292 62.327 62.314 62.326 0.0257 
19 62.313 62.387 62.315 62.318 62.341 62.335 0.0313 
20 62.375 62.321 62.354 62.342 62.375 62.353 0.0230 
21 62.399 62.308 62.292 62.372 62.299 62.334 0.0483 
22 62.309 62.403 62.318 62.295 62.317 62.328 0.0427 
23 62.293 62.293 62.342 62315 62.349 62.318 0.0264 
24 62.388 62.308 62.315 62.392 62.303 62.341 0.0448 
25 62.324 62.318 62.315 62.295 62.319 62.314 0.0111 


Gráfica р para la fracción de artículos defectuosos 


Cualquier artículo fabricado puede tener varias características que son importantes y 
deben ser examinadas por un inspector. Sin embargo, todo el procedimiento se enfoca 
aquí en una sola característica. Suponga que para todos los artículos la probabilidad de 
encontrar uno defectuoso es p, y que todos los artículos se producen de forma indepen- 
diente. Entonces, en una muestra aleatoria de n artículos producidos, con X como el 
número de artículos defectuosos, tenemos 


P(X=x)= (ra —р)"7*, х=0,1,2,...,п. 


Como se podría suponer, la media y varianza de la variable aleatoria binomial de- 
sempeñarán un papel importante en el desarrollo de la gráfica de control. El lector debería 
recordar que 

Е(Х)=пр у Var(X) = пр(1 — р). 
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Figura 17.7: Gráfica X con límites de control estable- Figura 17.8: Gráfica $ con límites de control esta- 


cidos con los datos del ejemplo 17.2. 


blecidos con los datos del ejemplo 17.2. 


Un estimador no sesgado de p es la fracción de defectuosos o la proporción de 
defectuosos, $, donde 


A 


número de defectuosos en la muestra de tamaño n 


n 


Como en el caso de las gráficas de control de variables, las propiedades de distribu- 
ción de p son importantes para la creación de la gráfica de control. Sabemos que 


1 = 
Еф) =p vip = PEP, 


Aquí aplicamos los mismos principios Зо que utilizamos para las gráficas de variables. 
Supongamos inicialmente que conocemos p. Entonces, la estructura de las gráficas de 
control implica utilizar límites 30 con 


A |= 
62 (ІРО Р) 
п 
De esta manera, los límites son 
1— 1— 
LCI =p q LEU LCS zp O 
n n 


con el proceso considerado bajo control cuando los valores р de la muestra caen dentro 
de los límites de control. 

En general, por supuesto, no se conoce el valor de p y se debe estimar a partir de 
un conjunto base de muestras de forma muy similar al caso de u y сеп las gráficas de 
variables. Suponga que hay m muestras preliminares de tamaño n. Para una muestra 
dada, cada una de las n observaciones se reporta como “defectuosa” o “no defectuosa”. 
El estimador no sesgado evidente para p que se utiliza en la gráfica de control es 
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donde р, es la proporción de artículos defectuosos en la ¡-ésima muestra. Como resul- 
tado, los límites de control son 


[РП — pú — 
LCI= р =3 a , línea central = р, LCS =p +3 РОР) Р) 
п п 


Ejemplo 17.3: | Considere los datos que se presentan en la tabla 17.3 sobre el número de componentes 
electrónicos defectuosos en muestras de tamaño 50. Se tomaron 20 muestras con la fina- 
lidad de establecer valores preliminares para la gráfica de control. Las gráficas de control 
determinadas por este periodo preliminar tendrán una línea central $ = 0.088 y límites 
de control 


1 І 
isso HA = _0.0322 y Los =p+x PP P- 0.2082. 


Tabla 17.3: Datos para el ejemplo 17.3 que permiten establecer límites de control 
en gráficas p, con muestras de tamaño 50 


Número de Fracción de defectuosos 
Muestra componentes defectuosos Îi 
1 8 0.16 
2 6 0.12 
3 5 0.10 
4 7 0.14 
5 2 0.04 
6 5 0.10 
7 3 0.06 
8 8 0.16 
9 4 0.08 
10 4 0.08 
11 3 0.06 
12 1 0.02 
13 5 0.10 
14 4 0.08 
15 4 0.08 
16 2 0.04 
17 3 0.06 
18 5 0.10 
19 6 0.12 
20 3 0.06 
P = 0.088 


Evidentemente, con un valor calculado negativo, el LCI se ajusta a cero. A partir de los 
valores de los límites de control al parecer el proceso está bajo control durante este pe- 
riodo preliminar. J 


Selección del tamaño de la muestra para la gráfica p 


La elección del tamaño de la muestra para la gráfica p de atributos incluye los mismos 
tipos generales de consideraciones que los de la gráfica para variables. Se requiere un 
tamaño de la muestra tan grande como para tener una alta probabilidad de detectar una 
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condición fuera de control cuando, de hecho, ha ocurrido un cambio específico en p. No 
existe un mejor método para elegir el tamaño de la muestra. Sin embargo, Duncan (1986; 
véase la bibliografía) sugirió una aproximación razonable que consiste en elegir una n 
tal que haya 0.5 de probabilidades de detectar un cambio de una cantidad particular en 
p. La solución resultante para n es bastante simple. Suponga que se aplica la aproxima- 
ción normal a la distribución binomial. Deseamos, siempre que la condición de p haya 
cambiado a, digamos, p, > р,, que 


P(p>LCS) =P 


№р1(1 —p1)/n 


А : РР 


Como P(Z > 0) = 0.5, se establece 


LCS = Ppi 


\/р(1 pna 


+зуР Р) су, 
(р — -pp +3 PP p) =0. 


Ahora podemos calcular n, el tamaño de cada muestra: 


Al sustituir, 


tenemos 


9 
п =-хур(1— р), 


donde, desde luego, A es el “cambio” en el valor de p, у р es la probabilidad de un ar- 
tículo defectuoso sobre la que se basan los límites de control. Sin embargo, si las gráficas 
de control se basan en límites ko, entonces 


k2 
n= mal =p): 


Ejemplo 17.4: | Suponga que se diseña una gráfica de control de calidad de atributos con un valor de p = 
0.01 para la probabilidad de tener bajo control un artículo defectuoso. ¿Cuál es el tama- 
ño de la muestra por subgrupo que produce una probabilidad de 0.5 de que se detecte un 
cambio en el proceso para p = p, = 0.05? La gráfica p resultante incluirá límites 30. 

Solución: Aquí tenemos A = 0.04. El tamaño adecuado de la muestra es 


= 00, -— (0.01)(0.99) = 55.69 = 56. 
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Gráficas de control para artículos defectuosos 
(uso del modelo de Poisson) 


En el procedimiento anterior supusimos que el artículo bajo consideración es uno que 
está defectuoso, es decir, que no funciona, o uno que no tiene defecto, en cuyo caso el 
artículo funciona y, por lo tanto, es aceptable para el consumidor. En muchas situaciones 
este método del artículo “defectuoso o no” es demasiado simplista. Las unidades pueden 
contener defectos o no cumplir con las especificaciones, y aun así funcionar bastante 
bien para el consumidor. En realidad, en este caso sería importante ejercer control sobre 
el número de defectos o número de artículos que no cumplen las especificaciones. Este 
tipo de control de calidad tiene aplicación cuando las unidades no son simplistas ni 
grandes. Por ejemplo, el número de defectos puede ser muy útil como objeto de control 
cuando el artículo o unidad es, digamos, una computadora personal. Otro ejemplo es una 
unidad definida por 50 pies de tubería fabricada, donde el número de soldaduras defec- 
tuosas es el objeto del control de calidad; el número de defectos en 50 pies de alfombra 
fabricada o el número de “burbujas” en una hoja grande de vidrio fabricado. 

A partir de lo aquí descrito queda claro que en este caso no es apropiada la distribu- 
ción binomial. El número total de artículos que no cumplen las especificaciones en una 
unidad o el número promedio por unidad se podría usar como la medida para la gráfica 
de control. A menudo se supone que el número de artículos que no cumplen las especi- 
ficaciones en una muestra tiene una distribución de Poisson. A este tipo de gráfica con 
frecuencia se le llama gráfica C. 

Suponga que el número de defectos X en una unidad de producto tiene una distribu- 
ción de Poisson con parámetro A. (Aquí t = 1 para el modelo de Poisson). Recuerde que 
para la distribución de Poisson, 

Е 
хі 


Р(Х = х) = А Ое 

Aquí, la variable aleatoria X es el número de artículos que no cumplen las especificacio- 
nes. En el capítulo 5 vimos que tanto la media como la varianza de la variable aleatoria 
de Poisson son A. Por consiguiente, si la gráfica de control de calidad se estructurara de 
acuerdo con los límites Зс acostumbrados, si conociéramos А tendríamos, 


LCS =A + 3VA, línea central = A, LCI = A— Зул . 


Como de costumbre, А a menudo debe provenir de un estimador de los datos. Un esti- 
mado no sesgado de А es el número promedio de artículos que no cumplen las especi- 
ficaciones por muestra. Este estimado se denota mediante А. Así, la gráfica de control 
tiene los límites 


A 


LCS =A+3VA,  Hneacentral=Á,  LCI= Á-3VÁ. 


Ejemplo 17.5: |La tabla 17.4 representa el número de defectos en 20 muestras sucesivas de rollos de 
hoja metálica, cada uno con 100 pies de largo. Para controlar el número de defectos en 
tales muestras se debe desarrollar una gráfica de control a partir de estos datos prelimi- 
nares. El estimado del parámetro de Poisson A es dado por Á= 5.95. Como resultado, los 
límites de control sugeridos por estos datos preliminares son 


LCS =143VA =132678 y 1С1=А—3\МА = —1.3678, 


donde LCI se iguala а cero. 
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Tabla 17.4: Datos para el ejemplo 17.5; el control implica el número de defectos en rollos de hojas metálicas 


Número de muestra Número de defectos Número de muestra Número de defectos 
1 8 11 3 
2 7 12 7 
3 5 13 5 
4 4 14 9 
5 4 15 7 
6 7 16 7 
7 6 17 8 
8 4 18 6 
9 5 19 7 
10 6 20 4 
Prom. 5.95 


La figura 17.9 presenta una gráfica de los datos preliminares con los límites de control. 

La tabla 17.5 incluye datos adicionales tomados del proceso de producción. Para 
cada muestra se inspeccionó la unidad en la que se basó la gráfica, a saber, 100 pies del 
metal. Se incluye la información de 20 muestras. La figura 17.10 muestra una gráfica de 
los datos adicionales de producción. Es evidente que el proceso está bajo control, o al 
menos lo estaba en el periodo en el que se tomaron los datos. 


Tabla 17.5: Datos adicionales del proceso de producción del ejemplo 17.5 


Número de muestra Número de defectos Número de muestra Número de defectos 


1 3 11 7 
2 5 12 5 
3 8 13 9 
4 5 14 4 
5 8 15 6 
6 4 16 5 
7 3 17 3 
8 6 18 2 
9 5 19 1 
10 2 20 6 


En el ejemplo 17.5 dejamos muy claro que la unidad de muestreo o de inspección 
son 100 pies de metal. En muchos casos en los que el artículo es específico, como en el 
caso de una computadora personal o el de un tipo específico de dispositivo electrónico, 
la unidad de inspección podría ser un conjunto de artículos. Por ejemplo, el analista 
decide utilizar 10 computadoras en cada subgrupo y de esta forma observar un conteo 
del número total de defectos encontrados. Por consiguiente, la muestra preliminar para 
construir la gráfica de control implica utilizar varias muestras, cada una de 10 compu- 
tadoras. La elección del tamaño de la muestra puede depender de muchos factores. A 
menudo deseamos un tamaño de la muestra que asegure un LCI positivo. 

El analista podría utilizar el número promedio de defectos por unidad de muestreo 
como la medida básica de la gráfica de control. Por ejemplo, para el caso de la compu- 
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Figura 17.9: Datos preliminares representados 
en la gráfica de control para el ejemplo 17.5. 
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Figura 17.10: Datos adicionales de produc- 
ción para el ejemplo 17.5. 


tadora personal, sea la variable aleatoria el número total de defectos 


U= número total de defectos 


n 


que se mide para cada muestra de, digamos, n = 10. Si suponemos que el número de 
defectos por unidad de muestreo es de Poisson con parámetro А, podemos utilizar el 
método de las funciones generadoras de momento para demostrar que U es una variable 
aleatoria de Poisson (véase el ejercicio de repaso 17.1). De esta manera, la gráfica de 
control para esta situación se caracteriza por lo siguiente: 


LOS =0+34/2, línea central = [7, бй =з”, 
п п 


Aquí, desde luego, С es el promedio de los valores U en el conjunto de datos prelimina- 
res о base. El término U/n se deriva del resultado que 


E(UO)= А, Var(U) = A 


y por ello С es un estimado no sesgado de E(U) = A y U/n es un estimado no sesgado 
de Var(U) = A/n. Este tipo de gráfica de control a menudo se denomina gráfica U. 

En esta sección basamos toda la explicación de las gráficas de control en el modelo 
de probabilidad de Poisson. Este modelo se ha utilizado en combinación con el concepto 
Зо. Como explicamos antes en este capítulo, el concepto de límites 30 tiene sus raíces 
en la aproximación normal, aunque muchos usuarios consideran que el concepto fun- 
ciona bien como herramienta pragmática incluso si la normalidad no es siquiera aproxi- 
madamente correcta. La dificultad, desde luego, radica en el hecho de que, en ausencia 
de normalidad, no es posible controlar la probabilidad de una especificación incorrecta de 
un estado fuera de control. En el caso del modelo de Poisson, cuando А es pequeña 
la distribución es bastante asimétrica, una condición que puede producir resultados inde- 
seables si se utiliza el método 30. 
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17.6 Gráficas de control de cusum 


La desventaja de las gráficas de control similares a las de Shewhart, que se explicaron y 
ejemplificaron en las secciones anteriores, radica en su incapacidad para detectar peque- 
ños cambios en la media. Un mecanismo de control de calidad que ha recibido mucha 
atención en la literatura estadística y que se ha utilizado extensamente en la industria es 
la gráfica de suma acumulada (cusum). El método de la gráfica de suma acumulada 
es sencillo y, por lo tanto, atractivo. Para el lector debe ser evidente por qué es más sen- 
sible a pequeños cambios en la media. Considere una gráfica de control para la media 
con un nivel de referencia establecido en el valor W. Considere las observaciones par- 
ticulares X p Agur Aa Las primeras cusum r son 


Si =X № 
S2 = Sı + (X2 — W) 
53 = S2 + (Хз — W) 


S, = 5,1 +(X, — W). 


Es evidente que la cusum es simplemente la acumulación de las diferencias del nivel de 
referencia. Es decir, 


k 
Зе у (хони). E=l Zi 


і=1 


La gráfica cusum es, entonces, una gráfica de 5, contra el tiempo. 

Suponga que consideramos que el nivel de referencia W es un valor aceptable de 
la media u. Salta a la vista que, si no hay cambio en и, la gráfica cusum debería ser 
aproximadamente horizontal, con algunas fluctuaciones menores balanceadas alrededor 
de cero. Ahora, si sólo hay un cambio moderado en la media, debe resultar un cambio 
más o menos grande en la pendiente de la gráfica cusum, dado que cada nueva observa- 
ción tiene la probabilidad de contribuir a un cambio y la medida que se grafica acumula 
esos cambios. Desde luego, la señal de que la media ha cambiado reside en la naturaleza 
de la pendiente de la gráfica cusum. El objetivo de la gráfica es detectar cambios que se 
alejan del nivel de referencia. Una pendiente diferente de cero (en cualquier dirección) 
representa un cambio a partir del nivel de referencia. Una pendiente positiva indica un 
aumento en la media por arriba del nivel de referencia, en tanto que una pendiente nega- 
tiva señala una disminución. 

Las gráficas cusum a menudo se diseñan con un nivel de calidad aceptable definido 
(NCA) y un nivel de calidad rechazable (NCR) preestablecido por el usuario. Ambos 
representan valores de la media. Se podría considerar que éstos desempeñan papeles 
similares a los de las medias nula y alternativa en la prueba de hipótesis. Considere una 
situación en la que el analista desea detectar un aumento en el valor de la media del pro- 
ceso. Usaremos la notación u, para МСА y и, para NCR, y и, > и,. El nivel de referencia 
se fija ahora en 


Ho + pa 
W = == —. 
2 
Los valores de 5 (r = 1, 2,...) tendrán una pendiente negativa si la media del proceso está 


en 1, y una pendiente positiva si la media del proceso está en и. 


706 


Capítulo 17 Control estadístico de la calidad 


Regla de decisión para las gráficas cusum 


Como antes se expuso, la pendiente de la gráfica cusum proporciona la señal de acción 
para el analista de control de calidad. La regla de decisión exige tomar medidas si, en el 
r-ésimo periodo de muestreo, 


d; >h; 


donde h es un valor preestablecido que se denomina longitud del intervalo de decisión y 
d, =S,— mín S;. 
isrer-1 
En otras palabras, se toman medidas si los datos revelan que el valor de la cusum real 
excede en una cantidad específica al valor previo de la cusum más pequeño. 

Una modificación en la mecánica que se describió antes facilita el uso del método. 
Describimos un procedimiento que grafica las cusum y calcula las diferencias. Una mo- 
dificación simple implica graficar las diferencias de manera directa y permitir la verifi- 
cación contra el intervalo de decisión. La expresión general para d, es muy sencilla. Para 
el procedimiento de cusum, con el que se detectan aumentos en la media, 


d, = тах[0, 4,1 + (Хх, = №)]. 


La elección del valor de h es, por supuesto, muy importante. En este libro no se 
proporcionan los detalles que aparecen en la literatura que trata de esta elección. Para 
una exposición más completa se remite al lector a Ewan y Kemp, 1960, y a Montgomery, 
20006 (véase la bibliografía). Una consideración importante es la longitud esperada de 
la corrida. De manera ideal, la longitud esperada de la corrida es bastante grande bajo 
и = 1, y muy pequeña cuando и = ш. 


Ejercicios de repaso 


cd кашан ee ў Xy +» X „ como variables aleato- Muestra X R 

rias de Poisson independientes con parámetros и, Hy... 9 2.3951 00068 
4, Utilice las propiedades de las funciones generadoras 10 24215 0.0048 
de momento para demostrar que la variable aleatoria X 11 2.3887 0.0082 


n El 12 2.4107 0.0032 


X,es una variable aleatoria de Poisson con media У и, 13 2.4009 0.0077 


п 
у varianza У и. 
= 


14 2.3992 0.0107 
15 2.3889 0.0025 
16 2.4107 0.0138 


17.2 Considere los siguientes datos tomados еп 17 2.4109 0.0037 
subgrupos de tamaño 5. Los datos contienen 20 pro- 18 2.3944 0.0052 
medios y rangos del diámetro (en milímetros) de una 19 2.3951 0.0038 

20 2.4015 0.0017 


parte importante de un motor. Elabore gráficas X y R. 


¿Parecería que el proceso está bajo control? 


17.3 En el ejercicio de repaso 17.2 suponga que el 


Muestra X R comprador fija especificaciones para la parte. Las es- 
1 2.3972 0.0052 pecificaciones exigen que el diámetro caiga en el rango 
2 2.4191 0.0117 cubierto por 2.40000 + 0.0100 mm. ¿Qué proporción 
3 2.4215 0.0062 de unidades producidas por este proceso no cumplirán 
4 2.3917 0.0089 con las especificaciones? 
5 2.4151 0.0095 17.4 Para la situación del ejercicio de repaso 17.2 
6 2.4027 0.0101 proporcione estimados numéricos de la media y de la 
e Е оо desviación estándar del diámetro рага la parte que se 


fabrica en el proceso. 


Ejercicios de repaso 


17.5 Considere los datos de la tabla 17.1. Suponga 
que se toman muestras adicionales de tamaño 5 y que 
se registra la resistencia a la tensión. El muestreo pro- 
duce los siguientes resultados (en libras por pulgada 
cuadrada). 


Muestra X R 


1 1511 22 
2 1508 14 
3 1522 11 
4 1488 18 
5 1519 6 
6 1524 П 
7 1519 8 
8 1504 7 
9 1500 8 


10 1519 14 


a) Grafique los datos, utilice las gráficas Ху R para 
los datos preliminares de la tabla 17.1. 

b) ¿Parecería que el proceso está bajo control? Si no 
es así, explique por qué. 

17.6 Considere un proceso bajo control con media 
и = 25 y о = 1.0. Suponga que se usan subgrupos de 
tamaño 5 con límites de control и + 30/4n y línea cen- 
tral en и. Suponga que ocurre un cambio en la media, y 
que la nueva media es и = 26.5. 

a) ¿Cuál es el número promedio de muestras requeri- 
das (después del cambio) para detectar la situación 
fuera de control? 

b) ¿Cuál es la desviación estándar del número de co- 
rridas requeridas? 


17.7 Considere la situación del ejemplo 17.2. Se to- 
man los siguientes datos de muestras adicionales de 
tamaño 5. Grafique los valores X y S sobre las gráfi- 
cas Xy S que se dibujaron con los datos en la muestra 
preliminar. ¿Parecería que el proceso está bajo control? 
Explique su respuesta. 


Muestra X Si 
1 62.280 0.062 
2 62.319 0.049 
3 62.297 0.077 
4 62.318 0.042 
5 62.315 0.038 
6 62.389 0.052 
7 62.401 0.059 
8 62.315 0.042 
9 62.298 0.036 
10 62.337 0.068 


17.8 Cada hora se toman muestras de tamaño 50 de 
un proceso que produce cierto tipo de artículo que se 
considera que está defectuoso o que no tiene defecto. 
Se toman 20 muestras. 
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a) Construya una gráfica de control para controlar la 
proporción de artículos defectuosos. 

b) ¿Parecería que el proceso está bajo control? Expli- 
que su respuesta. 


Número de Número de 
artículos artículos 

Muestra defectuosos | Muestra defectuosos 
1 4 11 2 
2 3 12 4 
3 5 13 1 
4 3 14 2 
5 2 15 3 
6 2 16 1 
7 2 17 1 
8 1 18 2 
9 4 19 3 
10 3 20 1 


17.9 Para la situación del ejercicio de repaso 17.8 su- 
ponga que se reúnen los siguientes datos adicionales: 


Muestra Número de artículos defectuosos 
1 3 
2 4 
3 2 
4 2 
5 3 
6 1 
7 3 
8 5 
9 7 

10 7 


¿Parecería que el proceso está bajo control? Explique 
su respuesta. 


17.10 Se aplica un programa de control de calidad 
para un proceso, donde se fabrican grandes placas de 
acero, con un interés especial por los defectos super- 
ficiales. El objetivo es establecer una gráfica de con- 
trol de calidad para el número de defectos por placa. 
Los datos se presentan a continuación. Elabore la grá- 
fica de control apropiada utilizando esta información. 
¿Parecería que el proceso está bajo control? 


Número de Número de 
Muestra defectos Muestra defectos 
1 4 11 1 
2 2 12 2 
3 1 13 2 
4 3 14 3 
5 0 15 1 
6 4 16 4 
7 5 17 3 
8 3 18 2 
9 2 19 1 
10 2 20 3 


Capítulo 18 


Estadística bayesiana 


18.1 Conceptos bayesianos 


Los métodos clásicos de estimación que hemos estudiado hasta ahora se basan sólo en 
la información que brinda la muestra aleatoria. Estos métodos en esencia interpretan 
probabilidades como frecuencias relativas. Por ejemplo, para obtener un intervalo de 
confianza de 95% para u, interpretamos la aseveración 


P (—1.96 < Z < 1.96) = 0.95 


para afirmar que, en experimentos repetidos, Z caerá 95% de las veces entre —1.96 y 
1.96. Dado que 
X -u 


=. 


para una muestra normal con varianza conocida, el enunciado de probabilidad aquí sig- 
nifica que 95% de los intervalos aleatorios (X—1.960/ Vn, X+1.960 / vn ) contienen la 
media и verdadera. Otro enfoque de los métodos estadísticos de estimación se denomina 
metodología bayesiana. La idea principal del método proviene de la regla de Bayes, que 
examinamos en la sección 2.7. La diferencia fundamental entre el enfoque bayesiano y 
el clásico o frecuente es que en los conceptos bayesianos los parámetros se consideran 
variables aleatorias. 


Probabilidad subjetiva 


La probabilidad subjetiva es el fundamento de los conceptos bayesianos. En el capítulo 
2 analizamos dos acercamientos posibles a la probabilidad, es decir, el método de la fre- 
cuencia relativa y el método de la indiferencia. El primero determina una probabilidad 
como una consecuencia de experimentos repetidos. Por ejemplo, para decidir el porcen- 
taje de tiros libres de un jugador de basquetbol, podemos registrar el número de tiros 
que hace y el número total de intentos que tal jugador ha hecho hasta el momento. La 
probabilidad de que este jugador acierte un tiro libre se puede calcular como el cociente 
de estos dos números. Por otro lado, si no sabemos acerca de cualquier sesgo en un dado, 
la probabilidad de que aparezca un 3 en el siguiente lanzamiento será de 1/6. Dicho enfo- 
que en la interpretación de la probabilidad se basa en la regla de la indiferencia. 
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Sin embargo, en muchas situaciones no es posible aplicar las interpretaciones de 
probabilidad anteriores. Por ejemplo, considere las siguientes preguntas: “¿Qué probabi- 
lidad hay de que llueva mañana?” “¿Qué tan probable es que el precio de estas acciones 
aumente a fin de mes?” y “¿Cuál es la probabilidad de que dos empresas se fusionen?”. 
Estas preguntas difícilmente se podrían interpretar mediante los enfoques anteriores, 
y las respuestas podrían ser diferentes para distintas personas. No obstante, este tipo 
de preguntas se plantean constantemente en la vida diaria y el enfoque utilizado para 
explicar esas probabilidades se llama probabilidad subjetiva, ya que refleja opiniones 
subjetivas. 


Perspectiva condicional 


Recuerde que en los capítulos 9 a 17 todas las inferencias estadísticas se basaban en 
el hecho de que los parámetros se desconocen pero son cantidades fijas, excepto los 
revisados en la sección 9.14, en donde los parámetros se trataron como variables y 
los estimados de máxima verosimilitud (EMV) se calcularon con base en la muestra de 
datos observados. En la estadística bayesiana los parámetros no sólo se manejan como 
variables, como en los cálculos de EMV, sino que también se manejan como aleatorios. 

Puesto que los datos observados son los únicos resultados experimentales para el 
profesionista, la inferencia estadística se basa en los datos reales observados a partir de 
un experimento dado. A esta visión se le llama perspectiva condicional. Más aún, en los 
conceptos bayesianos, dado que los parámetros se manejan como aleatorios, es factible 
especificar una distribución de probabilidad, por lo general utilizando la probabilidad 
subjetiva para el parámetro. Este tipo de distribución se denomina distribución previa y 
comúnmente refleja la creencia previa del experimentador acerca del parámetro. En la 
perspectiva bayesiana, una vez que se realiza un experimento y se observan los datos, 
todo el conocimiento acerca de un parámetro está contenido en los datos reales observa- 
dos, así como en la información previa. 


Aplicaciones bayesianas 


Aunque la regla de Bayes se atribuye a Thomas Bayes, las aplicaciones bayesianas fue- 
ron utilizadas por primera vez por el científico francés Pierre Simon Laplace, quien pu- 
blicó un artículo sobre el uso de la inferencia bayesiana en las proporciones binomiales 
desconocidas (para revisar la distribución binomial véase la sección 5.2). 

A partir de la introducción del paquete para el cálculo de la cadena Markov de 
Monte Carlo (MCMC) para el análisis bayesiano a principios de la década de 1990, 
los métodos bayesianos se han vuelto cada vez más populares para los modelos estadís- 
ticos y el análisis de datos. Al mismo tiempo, la metodología que utiliza conceptos ba- 
yesianos ha avanzado mucho y se aplica en campos como la bioinformática, la biología, 
los negocios, la ingeniería, las ciencias ambientales y la ecología, así como en la ciencia 
de la vida y la salud, entre otros. 


18.2 Inferencias bayesianas 


Considere el problema de calcular un estimado puntual del parámetro Ө para la población 
con distribución /(х |0), dado 6. Denote con л(0) la distribución previa de q. Suponga 
que se observa una muestra aleatoria de tamaño n denotada con x = (х, Жон» x). 
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Definición 18.1: La distribución de 0, dado х, que se denomina distribución posterior, es dada por 


F(x10)71(0) 


TONS ga) 


donde g(x) es la distribución marginal de x. 


La distribución marginal de x en la definición anterior se puede calcular usando la 
siguiente fórmula: 


У) (x10)710), Ө es discreta, 
gax) = | ө 
Jf- 010)7(0) 40, 0 es continua. 


Ejemplo 18.1: | Suponga que la distribución previa para la proporción de artículos defectuosos que pro- 


duce una máquina es 
p | 0.1 0.2 


mp) | 0.6 04 


Denote con x el número de artículos defectuosos en una muestra aleatoria de tamaño 2. 
Calcule la distribución de probabilidad posterior de p, dado que se observa x. 
Solución: La variable aleatoria X sigue una distribución binomial 


Flo) = нк) (ре, х =0,1,2 
La distribución marginal de x se puede calcular como 
g(x) = f (x]0.1)7(0.1) + f (x]0.2)7(0.2) 
= C) [(0.1)*(0.9)2*(0.6) + (0.2)* (0.8)27* (0.4)]. 
Por lo tanto, para x = 0, 1, 2 obtenemos las siguientes probabilidades marginales 


x | 0 1 2 
800) | 0.742 0236 0.022 


La probabilidad posterior de р = 0.1, dado x, es 


F(x]0.1)7r(0.1) _ (0.1)*(0.9)2-* (0.6) 
g(x) 2 (0.1) (0.9)2—* (0.6) + (0.2)*(0.8)2-*(0.4)” 


y 7(0.2|х) = 1 – 700. Ц). 


(0. 1|x) = 


Suponga que se observa x = 0. 
_f(0]|0.1)7(0.1) _ (0.1)°(0.9)2—9(0.6) 
800) 0.742 
y 7(0.2|0) = 0.3450. Si se observa х = 1, 7r(0.1]1) = 0.4576 у 7(0.2|1) = 0.5424. Por 
último, 7 (0.1|2) = 0.2727 y 7(0.2|2) = 0.7273. I 
La distribución previa del ejemplo 18.1 es discreta, aunque el rango natural de p va 


de 0 a 1. Considere el siguiente ejemplo, en el cual tenemos una distribución previa que 
abarca el espacio completo de p. 


7r(0.1]0) = 0.6550, 
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Ejemplo 18.2: | Suponga que la distribución previa de р es uniforme, es decir, л(р) = 1, рага0 <р < 1. 


Solución: 


Use la misma variable aleatoria X que en el ejemplo 18.1 para calcular la distribución 
posterior de p. 
Сото en el ejemplo 18.1, tenemos 


2 =x 
Оор) =b(x32, p) = (Jo t, x=0,1,2. 
La distribución marginal de x se puede calcular como 
gx) =/ FGlpr(p) dp = C) I PA = р)?“ dp. 
0 0 


La integral anterior se puede evaluar en cada x directamente como g(0) = 1/3, 2(1) = 1/3 
у (2) = 1/3. Por lo tanto, la distribución posterior de p, dado x, es 


2 E ИЕ 2—х 
т(р|х) = Башы = (Jota ap о. 0<p<l. 
х 


La distribución posterior anterior es en realidad una distribución beta (véase la sección 
6.8) con parámetros а = x +1 y 8 = 3 — x. Por lo tanto, si se observa х = 0, la distribu- 
ción posterior de p es una distribución beta con parámetros (1, 3). La media posterior es 
u = ту = 1 y la varianza posterior es с? = т==г; = J 

Si utilizamos la distribución posterior, podemos estimar directamente el (los) 
parámetro(s) en una población. Al calcular las distribuciones posteriores es muy útil es- 
tar familiarizado con las distribuciones que se estudiaron en los capítulos 5 y 6. Observe 
que en la definición 18.1 la variable en la distribución posterior es 6, en tanto se propor- 
cione x. Por consiguiente, podemos tratar a g(x) como una constante cuando calculamos 
la distribución posterior de Ө. Entonces, la distribución posterior se puede expresar como 


п(Ө|х) сў (х |0)7(0), 


donde el símbolo “ос” significa proporcional a. En el cálculo que se hizo de la distribu- 
ción posterior podríamos dejar los factores que no dependen de 0 fuera de la constante 
de normalización, esto es, la densidad marginal g(x). 


Ejemplo 18.3 | Suponga que las variables aleatorias X',..., X, son independientes y provienen de una 


Solución: 


distribución de Poisson con media А. Suponga que la distribución previa de А es expo- 
nencial con media 1. Calcule la distribución posterior de А cuando х = 3 соп n = 10. 
La función de densidad de X = (X КОТ X) es 


y la distribución previa es 


T(0)=e7?, para А > 0. 
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En consecuencia, utilizando la definición 18.1 se obtiene la siguiente distribución pos- 
terior de А 
$ Xi n 
Д Ä Ху = —пА =! =A —(п FDA E 
TAL) x f JATA) = e Ge? се 
П Xi ! 
i=l 


Si nos remitimos a la distribución gamma en la sección 6.6, concluimos que la distribu- 


n 
ción posterior de А sigue una distribución gamma con parámetros 1 + У) x; y + Por 
i=l 


А | AT УМ ү жг+1 
lo tanto, tenemos la media y la varianza posterior de A сото ==— У “Сту? 
Así, cuando x = 3 con n = 10, tenemos En, x; = 30. Por lo tanto, la distribución 
posterior de А es una distribución gamma con parámetros 31 y 1/11. JJ 


A partir del ejemplo 18.3 observamos que en ocasiones es muy conveniente usar la 
técnica “proporcional a” para calcular la distribución posterior, especialmente cuando el 
resultado se puede formar para una distribución de uso común como las que se describen 
en los capítulos 5 y 6. 


Estimación puntual mediante la distribución posterior 


Una vez que hemos derivado la distribución posterior, fácilmente podemos usar el resu- 
men de la distribución posterior para hacer inferencias sobre los parámetros de la pobla- 
ción. Por ejemplo, la media, la mediana y la moda posteriores son útiles para estimar el 
parámetro. 


Ejemplo 18.4: | Suponga que en el ejemplo 18.2 se observa х = 1. Determine la media y la moda poste- 
riores. 
Solución: Cuando x = 1, la distribución posterior de р se puede expresar como 


п(р|1) = 6р(1 —p), para O<p<l. 


Para calcular la media de esta distribución necesitamos encontrar 


Р 11 1 
2 = = — — — = — 
/ 6p*(1 —p) dp JE 3) z 


Para determinar la moda posterior se requiere obtener un valor p tal que se maximice la 
distribución posterior. Si tomamos la derivada de 7(p) respecto а p, obtenemos 6 — 12р. 
Al despejar р en 6 — 12р = 0, obtenemos р = %. La segunda derivada es —12, la cual 
implica que la moda posterior se logra en p = Y. 2 

Los métodos bayesianos de estimación respecto а Іа media u de una población nor- 
mal se basan en el siguiente ejemplo. 


Ejemplo 18.5: | Si Y es la media de una muestra aleatoria de tamaño n tomada de una población normal 
con varianza conocida g*, y la distribución previa de la media poblacional es una distri- 
bución normal con media conocida и, y varianza conocida сз, demuestre que la distribución 
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posterior de la media poblacional es también una distribución normal con media и* y 
desviación estándar o*, donde 


La función de densidad de la muestra es 
n 2 
А _ 1 1 Xi— H К 
favan D= ra -3 o ) | 


рага —00 < x, < œ e i = 1, 2,...п, y la previa es 


PORE.. ET _ 


Entonces la distribución posterior de и es 


1 n а 2 _ 2 
т(Ш|х) x exp Е з Ё - 2) + (=+) | | 
і=1 


СР. КТЕ: 
хер | Б w y e |, 


а? 0% 


debido a 
Уо; — Ш? = ` G; =) + п(х — и)? 
¡=1 i=] 


de la sección 8.5. Al completar los cuadrados para u se obtiene la distribución posterior 


donde 


= 72 2 2 
ba nxo + yO з ajo? 
nog +o? ” nog + о? 


Ésta es una distribución normal con media и“ y desviación estándar с“. И | 

El teorema del límite central nos permite utilizar el ejemplo 18.5 también cuando 
seleccionamos muestras aleatorias suficientemente grandes (n > 30 para muchos casos 
de experimentación en ingeniería), a partir de poblaciones no normales (la distribución 
no dista mucho de ser simétrica), y cuando la distribución previa de la media es aproxi- 
madamente normal. 

Resulta pertinente hacer algunos comentarios acerca del ejemplo 18.5. La media 
posterior и* también se puede escribir como 


. од оу 
= X A 
H o+ o?/n 02+ o? np?" 


que es el promedio ponderado de la media muestral ¥ y la media previa и. Como ambos 
coeficientes están entre O y 1 y se suman a 1, la media posterior u* siempre se encuentra 
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entre Y y и. Esto significa que tanto х como 4, influyen en la estimación posterior de и. 
Además, la ponderación de x depende de la varianza previa, así como de la varianza de la 
media muestral. Рага un problema con una muestra grande (n — оо), la media posterior 
и* — X. Esto significa que la media previa no desempeña ningún papel en la estimación 
de la media poblacional и utilizando la distribución posterior. Esto es muy razonable, 
puesto que indica que cuando una cantidad de datos es sustancial, la información a partir 
de los datos dominará la información de u proporcionada por la previa. Por otro lado, 
cuando la varianza previa es grande (0% — оо), la media posterior u* también va hacia х. 
Observe que para una distribución normal, cuanto mayor es la varianza, más plana será 
la función de densidad. El carácter plano de la distribución normal en este caso significa 
que casi no hay información previa subjetiva disponible del parámetro и antes de reunir 
los datos. Por lo tanto, es razonable que la estimación posterior u* sólo dependa del valor 
de los datos de Х. 

Ahora considere la desviación estándar posterior o*. Este valor también se escribe 
como 


Es evidente que el valor с* es menor que с, y que 0//n, la desviación estándar previa y 
la desviación estándar de х, respectivamente. Esto sugiere que la estimación posterior es 
más precisa que la previa y que los datos muestrales. En consecuencia, la incorporación 
tanto de los datos como de la información previa produce una mejor información poste- 
rior que si se utiliza cualquiera de los datos o la información previa por sí solos. Esto es 
un fenómeno común еп la inferencia bayesiana. Además, para calcular u* y o% mediante 
las fórmulas del ejemplo 18.5 suponemos que se conoce o°. Como por lo general éste no 
es el caso, deberemos reemplazar 0? por la varianza de la muestra s? siempre que n > 30. 


Estimación del intervalo bayesiano 


Definición 18.2: 


De manera similar al intervalo de confianza clásico, en el análisis bayesiano podemos 
calcular un intervalo bayesiano del 100(1 — œ)% empleando la distribución posterior. 


El intervalo а < 0 < b se denomina intervalo de Bayes del 100(1 — 09% para Ө si 


Q 


А л(@|х) d0 =). л(8|х) 40 = 5. 
—оо b 


Recuerde que, de acuerdo con el enfoque frecuentista, la probabilidad de un inter- 
valo de confianza, digamos de 95%, se interpreta como una probabilidad de cobertura, 
esto significa que, si un experimento se repite una y otra vez (con considerables datos no 
observados), la probabilidad de que los intervalos calculados, de acuerdo con la regla, 
cubran el parámetro verdadero es de 95%. Sin embargo, en la interpretación del intervalo 
bayesiano, digamos para un intervalo de 95%, podemos decir que la probabilidad de que 
el parámetro desconocido caiga dentro del intervalo calculado (que sólo depende de los 
datos observados) es de 95%. 


Ejemplo 18.6: | Suponga que X ~ b(x; n, p) соп n = 2 conocida, y la distribución previa de p es uniforme 


п(р) = 1 para 0 < p < 1. Calcule el intervalo de Bayes de 95% para р. 
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Сото en el ejemplo 18.2, cuando x = 0 la distribución posterior es una distribución beta 
con parámetros 1 y 3, es decir, т(р|0) = 3(1 — p}, para 0 < р < 1. Por consiguiente, 
necesitamos despejar a y b utilizando la definición 18.2, lo que produce lo siguiente: 


0.025 = f 3(1 — p? dp =1 – (1-ay? 
0 


1 
0.025 =f 3(1—р)? ар = (1 — b. 
b 


Las soluciones a las ecuaciones anteriores dan como resultado a = 0.0084 y b = 0.7076. 
Por lo tanto, la probabilidad de que p caiga dentro de (0.0084, 0.7076) es de 95%. E 

Para la población normal y el caso previo normal descrito en el ejemplo 18.5, la me- 
dia posterior u* es el estimado de Bayes de la media poblacional и, y se puede construir 
un intervalo bayesiano para и de 100(1 — 0% calculando el intervalo 


Ш — Za/20* < p< pt +20/20*, 


que se centra en la media posterior y contiene 100(1 — 0)% de la probabilidad posterior. 


Ejemplo 18.7: | Una empresa de equipo eléctrico fabrica bombillas con una duración distribuida de for- 


Solución: 


ma aproximadamente normal y una desviación estándar de 100 horas. La experiencia 
previa nos conduce a creer que џи es un valor de una variable aleatoria normal con una 
media и, = 800 horas y una desviación estándar с, = 10 horas. Si una muestra aleatoria 
de 25 bombillas tiene una duración promedio de 780 horas, calcule un intervalo bayesia- 
no de 95% para и. 

De acuerdo con el ejemplo 18.5, la distribución posterior de la media también es una 
distribución normal con media 


„ _ 05)(780)(10) 2 + (800)(100)2 _ бё 
Е (25)(10)2 + (100)2 Е 


2 2 
сас 


y desviación estándar 


(25110)? + (100)? 


El intervalo bayesiano de 95% para u es dado entonces por 


796 — 1.9680 < u < 796 + 1.96\/80, 


778.5 < p < 813.5. 


En consecuencia, estamos 95% seguros de que u estará entre 778.5 y 813.5. 
Por otro lado, si desconocemos la información previa acerca de u, procedemos 
como en la sección 9.4 para construir el intervalo de confianza clásico de 95%. 


100 100 


1.96) | — 
з) <и<70 +; (75) 


о 740.8 < u < 819.2, el cual se ve que es más amplio que el intervalo bayesiano corres- 
pondiente. 


780 — (1.96) | 
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18.3 Estimados bayesianos mediante la teoría de decisión 


Con la metodología bayesiana se puede obtener la distribución posterior del parámetro. 
Los estimados bayesianos también se pueden derivar usando la distribución posterior 
y una función de pérdida cuando se incurre en una pérdida. Una función de pérdida es 
aquella que describe el costo de una decisión asociada con un suceso de interés. Aquí 
sólo se citan unas cuantas funciones de pérdida de uso común y sus estimados de Bayes 
asociados. 


Pérdida del cuadrado del error 


Definición 18.3: La función de pérdida del cuadrado del error es 
L(0, a) = (0— аў, 
donde 0 es el parámetro (o estado natural) y a una acción (o estimado). 


Un estimado de Bayes minimiza la pérdida posterior esperada dada en los datos 
muestrales observados. 


Teorema 18.1: La media de la distribución posterior тг (Ө|х), denotada con 0*, es el estimado de Bayes 
de 0 bajo la función de pérdida del cuadrado del error. 


Ejemplo 18.8: | Calcule el estimado de Bayes de p para todos los valores de x en el ejemplo 18.1 cuando 
se utiliza la función de pérdida del cuadrado del error. 
Solución: Cuando x = 0, p* = (0.1)(0.6550) + (0.2)(0.3450) = 0.1345. 
Cuando х = 1, p* = (0.1)(0.4576) + (0.2)(0.5424) = 0.1542. 
Cuando х = 2, p* = (0.1)(0.2727) + (0.2)(0.7273) = 0.1727. 
Observe que el estimado clásico de р es р = x/n = 0, Ya y 1, respectivamente, рага 
los valores de x en O, 1 y 2. Estos estimados clásicos son muy diferentes de los estimados 
de Bayes correspondientes. 


Ejemplo 18.9: | Repita el ejemplo 18.8 en la situación del ejemplo 18.2. 
Solución: Puesto que la distribución posterior de p es una distribución B(x + 1, 3 — x) (véase la 
sección 6.8 en la página 201), el estimado de Bayes de p es 


е 2А ү! | 
р*= ЕІ (р) = :( ) / pa — р)2-* ар, 
Xx) Jo 


que produce p* = М para x = 0, p* = Ya para x = 1, ур“ = % para x = 2, respectiva- 
mente. Advierta que cuando se observa x = 1, el estimado de Bayes y el estimado clásico 
de р son equivalentes. J 

Para la situación normal que se describe en el ejemplo 18.5 el estimado de Bayes de 
и bajo la pérdida del cuadrado del error será la media posterior џи“. 


Ejemplo 18.10: | Suponga que la distribución muestral de una variable aleatoria X es de Poisson con рага- 
metro А. Suponga que la distribución previa de А sigue una distribución gamma con 
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parámetros (œ, 8). Calcule el estimado de Bayes de А bajo la función de pérdida del 
cuadrado del error. 

Si utilizamos el ejemplo 18.3, concluimos que la distribución posterior de А sigue una 
distribución gamma con parámetros (х + о, (1 + 1/8)). Por medio del teorema 6.4 
obtenemos la media posterior 


А _ х+а 
141/86 
Como la media posterior es el estimado de Bayes bajo la pérdida del cuadrado del error, 
A es nuestro estimado de Bayes. JJ 


Pérdida del error absoluto 


Definición 18.4: 


Teorema 18.2: 


La pérdida del cuadrado del error descrita antes es similar al concepto de los mínimos 
cuadrados que se analizó en relación con la regresión en los capítulos 11 y 12. En esta 
sección presentamos otra función de pérdida como sigue. 


La función de pérdida del error absoluto se define como 
L (0, a) = |0 —al, 


donde 0 es el parámetro y a una acción. 


La mediana de la distribución posterior 7r(0|x), denotada con 6*, es el estimado de 
Bayes de 0 bajo la función de pérdida del error absoluto. 


Ejemplo 18.11: | 


Solución: 


Bajo la pérdida del error absoluto calcule el estimador de Bayes para el ejemplo 18.9 
cuando se observa х = 1. 

Nuevamente, la distribución posterior de р es B(x + 1,3 — x). Cuando x = 1 se trata de 
una distribución beta con densidad 7(р Іх = 1) = 6x(1 — x) para 0 < x < 1 y 0 en otro 
caso. La mediana de esta distribución es un valor de p* tal que 


1 А ж ж 
у= | 61-р) = 3р7 —2р°, 
0 


que produce la respuesta р“ = +. Por lo tanto, el estimado de Bayes en este caso es 0.5. 


Ejercicios 
18.1 Estime la proporción de artículos defectuosos P 0.05 0.10 0.15 
que produce la máquina del ejemplo 18.1 si la mues- T(p) 0.3 0.5 02 


tra aleatoria de tamaño 2 produce dos artículos defec- 


tuosos. 


18.2 Supongamos 


Si dos de las siguientes 9 bebidas de esta máquina se 
que la distribución previa рага la derraman, calcule 


proporción р de bebidas de una máquina despachadora а) la distribución posterior para la proporción р; 
que se derraman al servirse es b) el estimado de Bayes de p. 


Ejercicios 


18.3 Repita el ejercicio 18.2 cuando una de las si- 
guientes 4 bebidas se derrama y la distribución uni- 
forme previa es 


п(р) = 10, 0.05 <р < 0.15. 


18.4 Las llamadas de servicio llegan a un centro de 
mantenimiento de acuerdo con un proceso de Poisson 
con А llamadas por minuto. Un conjunto de datos de 
20 periodos de un minuto producen un promedio 
de 1.8 llamadas. Si la distribución previa de А sigue 
una distribución exponencial con media 2, determine la 
distribución posterior de A. 


18.5 Un estudio previo indica que el porcentaje de fu- 
madores empedernidos, p, que tienen cáncer de pulmón 
sigue una distribución beta (véase la sección 6.8) con 
media de 70% y desviación estándar de 10%. Suponga 
que un nuevo conjunto de datos recolectado indica que 
81 de 120 fumadores empedernidos tiene cáncer de 
pulmón. 

a) Determine la distribución posterior del porcentaje 
de fumadores empedernidos que tienen cáncer de 
pulmón combinando los nuevos datos y la infor- 
mación previa. 

b) ¿Cuál es la probabilidad posterior de que p sea 
mayor que 50%? 


18.6 El constructor de un nuevo complejo de con- 
dominios afirma que 3 de 5 compradores preferirá un 
departamento de dos recámaras, mientras que su ban- 
quero afirma que sería más correcto decir que 7 de 10 
compradores preferirán uno de dos recámaras. En las 
predicciones previas de este tipo el banquero ha sido 
dos veces más confiable que el constructor. Si 12 de 
los siguientes 15 condominios que se venden en este 
complejo son de dos recámaras, calcule 
a) las probabilidades posteriores que se asocian con 
las afirmaciones del constructor y del banquero; 
b) un estimado puntual de la proporción de comprado- 
res que prefieren un condominio de dos recámaras. 


18.7 El tiempo en que se consume la primera etapa 
de un cohete es una variable aleatoria normal con una 
desviación estándar de 0.8 minutos. Suponga una dis- 
tribución previa normal para и con una media de ocho 
minutos y una desviación estándar de 0.2 minutos. Si se 
lanzan 10 de estos cohetes y la primera etapa tiene un 
tiempo de consumo promedio de 9 minutos, calcule 
un intervalo bayesiano de 95% para и. 


18.8 La utilidad diaria de una máquina despachadora 
de jugos, ubicada en un edificio de oficinas, es un va- 
lor de una variable aleatoria normal, con media u y va- 
rianza 0? desconocidas. Desde luego, la media variará 
un poco de un edificio a otro, y el distribuidor considera 
que estas utilidades promedio diarias se pueden descri- 
bir mejor usando una distribución normal con media 
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H = $30.00 y desviación estándar с, = $1.75. Si una 
de estas máquinas despachadoras de jugo, ubicada en 
cierto edificio, muestra una utilidad promedio diaria de 
х = $24.90, durante los primeros 30 días con una des- 
viación estándar de s = $2.10, calcule 
a) un estimado de Bayes de la utilidad promedio dia- 
ria verdadera para este edificio; 
b) un intervalo bayesiano de 95% de и para este edi- 
ficio; 
c) la probabilidad de que la utilidad promedio diaria 
de la máquina en este edificio sea de entre $24.00 
y $26.00. 


18.9 El departamento de matemáticas de una uni- 
versidad grande diseña un examen de colocación para 
aplicarlo a los grupos de nuevo ingreso a primer año. 
Los miembros del departamento consideran que la 
calificación promedio para este examen variará de un 
grupo de primer año a otro. Esta variación de la califi- 
cación promedio del grupo se expresa de manera sub- 
jetiva mediante una distribución normal, con una media 
1, = 72 y una varianza 0 = 5.76. 

a) ¿Qué probabilidad previa existe de que la califi- 
cación promedio real, que asigna el departamento 
para los alumnos de nuevo ingreso del siguiente 
año, caiga entre 71.8 y 73.4? 

b) Construya un intervalo bayesiano de 95% para 
en el caso de que el examen se aplicara a una 
muestra aleatoria de 100 estudiantes de primer 
grado del siguiente grupo de nuevo ingreso y tu- 
viera como resultado una calificación promedio de 
70 con una varianza de 64. 

c) ¿Qué probabilidad posterior debería asignar el de- 
partamento al evento del inciso a? 


18.10 Suponga que en el ejemplo 18.7 la empresa de 
equipo eléctrico no tiene suficiente información previa 
respecto a la duración media poblacional que le permita 
suponer una distribución normal para u. La empresa 
cree, sin embargo, que u seguramente estará entre 770 
y 830 horas, y considera que una aproximación baye- 
siana más realista sería suponer una distribución previa 


1 
п(Ш) = 50° 770 < u < 830. 


Si una muestra aleatoria de 25 bombillas tiene una vida 
promedio de 780 horas, siga los pasos de la demos- 
tración del ejemplo 18.5 para encontrar la distribución 
posterior. 


п(ш | Ьа .,X25). 


18.11 Suponga que el tiempo T antes de que falle 
cierta bisagra es una variable aleatoria exponencial con 
densidad de probabilidad 


РО) = 0с", 1>0. 
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Por experiencia, nos inclinamos a pensar que Ө es un 
valor de una variable aleatoria exponencial con densi- 
dad de probabilidad 


п(0) = 2е72%, 9>0. 


Si tenemos una muestra de п observaciones de 7, de- 
muestre que la distribución posterior de O es una dis- 
tribución gamma 


n =l 
a=n+l y в= (ус +э\ : 


і=1 


18.12 Suponga que una muestra consta de 5, 6, 6, 7, 
5, 6,4, 9 y 3, y 6 proviene de una población de Poisson 
con media A. Suponga que el parámetro А sigue una 
distribución gamma con parámetros (3, 2). Bajo la fun- 
ción de pérdida del cuadrado del error, calcule el esti- 
mado de Bayes de A. 


18.13 Una variable aleatoria X sigue una distribución 
binomial negativa con parámetros k = 5 y р, es decir, 
b*(x; 5, p). Además, se sabe que p sigue una distri- 
bución uniforme en el intervalo (0, 1). Calcule el es- 
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timado de Bayes de p bajo la función de pérdida del 
cuadrado del error. 


18.14 Una variable aleatoria X sigue una distribución 
exponencial con media 1/8. Suponga que la distribu- 
ción previa de [З es otra distribución exponencial con 
media 2.5. Determine el estimado de Bayes de 8 bajo 
la función de pérdida del error absoluto. 


18.15 Una muestra aleatoria X',..., X proviene de una 
población con distribución uniforme (véase la sección 
6.1) con Ө desconocida. Los datos se presentan a con- 
tinuación: 
0.13, 1.06, 1.65, 1.73, 0.95, 0.56, 2.14, 0.33, 1.22, 
0.20, 1.55, 1.18, 0.71, 0.01, 0.42, 1.03, 0.43, 1.02, 
0.83, 0.88 


Suponga que la distribución previa de 0 tiene la den- 
sidad 
9, 0>1, 


= 1 0< 1. 


Determine el estimador de Bayes Бајо la función de 
pérdida del error absoluto. 
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Tabla A.1 Sumas de probabilidad binomial У bx; n, p) 


x=0 


р 
0.10 0.20 0.25 0.30 0.40 0.50 0.60 0.70 0.80 0.90 


0.9000 0.8000 0.7500 0.7000 0.6000 0.5000 04000 0.3000 0.2000 0.1000 
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 


0.8100 0.6400 0.5625 0.4900 0.3600 0.2500 0.1600 0.0900 0.0400 0.0100 
0.9900 0.9600 0.9375 0.9100 0.8400 0.7500 0.6400 0.5100 0.3600 0.1900 
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 


0.7290 0.5120 0.4219 0.3430 0.2160 0.1250 0.0640 0.0270 0.0080 0.0010 
0.9720 0.8960 0.8438 0.7840 0.6480 0.5000 0.3520 0.2160 0.1040 0.0280 
0.9990 0.9920 0.9844 0.9730 0.9360 0.8750 0.7840 0.6570 0.4880 0.2710 
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 


0.6561 0.4096 0.3164 0.2401 0.1296 0.0625 0.0256 0.0081 0.0016 0.0001 
0.9477 0.8192 0.7383 0.6517 0.4752 0.3125 0.1792 0.0837 0.0272 0.0037 
0.9963 0.9728 0.9492 0.9163 0.8208 0.6875 0.5248 0.3483 0.1808 0.0523 
0.9999 0.9984 0.9961 0.9919 0.9744 0.9375 0.8704 0.7599 0.5904 0.3439 
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 


0.5905 0.3277 0.2373 0.1681 0.0778 0.0313 0.0102 0.0024 0.0003 0.0000 
0.9185 0.7373 0.6328 0.5282 0.3370 0.1875 0.0870 0.0308 0.0067 0.0005 
0.9914 0.9421 0.8965 0.8369 0.6826 0.5000 0.3174 0.1631 0.0579 0.0086 
0.9995 0.9933 0.9844 0.9692 0.9130 0.8125 0.6630 0.4718 0.26277 0.0815 
1.0000 0.9997 0.9990 0.9976 0.9898 0.9688 0.9222 0.8319 0.6723 0.4095 
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 


0.5314 0.2621 0.1780 0.1176 0.0467 0.0156 0.0041 0.0007 0.0001 0.0000 
0.8857 0.6554 0.5339 0.4202 0.2333 0.1094 0.0410 0.0109 0.0016 0.0001 
0.9842 0.9011 0.8306 0.7443 0.5443 0.3438 0.1792 0.0705 0.0170 0.0013 
0.9987 0.9830 0.9624 0.9295 0.8208 0.6563 0.4557 0.2557 0.0989 0.0159 
0.9999 0.9984 0.9954 0.9891 0.9590 0.8906 0.7667 0.5798 0.3446 0.1143 
1.0000 0.9999 0.9998 0.9993 0.9959 0.9844 0.9533 0.8824 0.7379 0.4686 
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 


0.4783 0.2097 0.1335 0.0824 0.0280 0.0078 0.0016 0.0002 0.0000 
0.8503 0.5767 0.4449 0.3294 0.1586 0.0625 0.0188 0.0038 0.0004 0.0000 
0.9743 0.8520 0.7564 0.6471 0.4199 0.2266 0.0963 0.0288 0.0047 0.0002 
0.9973 0.9667 0.9294 0.8740 0.7102 0.5000 0.2898 0.1260 0.0333 0.0027 
0.9998 0.9953 0.9871 0.9712 0.9037 0.7734 0.5801 0.3529 0.1480 0.0257 
1.0000 0.9996 0.9987 0.9962 0.9812 0.9375 0.8414 0.6706 0.4233 0.1497 
1.0000 0.9999 0.9998 0.9984 0.9922 0.9720 0.9176 0.7903 0.5217 
1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 
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0.25 
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0.4305 
0.8131 
0.9619 
0.9950 
0.9996 
1.0000 


0.3874 
0.7748 
0.9470 
0.9917 
0.9991 
0.9999 
1.0000 


0.3487 
0.7361 
0.9298 
0.9872 
0.9984 
0.9999 
1.0000 


0.3138 
0.6974 
0.9104 
0.9815 
0.9972 
0.9997 
1.0000 


0.1678 
0.5033 
0.7969 
0.9437 
0.9896 
0.9988 
0.9999 
1.0000 


0.1342 
0.4362 
0.7382 
0.9144 
0.9804 
0.9969 
0.9997 
1.0000 


0.1074 
0.3758 
0.6778 
0.8791 
0.9672 
0.9936 
0.9991 
0.9999 
1.0000 


0.0859 
0.3221 
0.6174 
0.8389 
0.9496 
0.9883 
0.9980 
0.9998 
1.0000 


0.1001 
0.3671 
0.6785 
0.8862 
0.9727 
0.9958 
0.9996 
1.0000 


0.0751 
0.3003 
0.6007 
0.8343 
0.9511 
0.9900 
0.9987 
0.9999 
1.0000 


0.0563 
0.2440 
0.5256 
0.7759 
0.9219 
0.9803 
0.9965 
0.9996 
1.0000 


0.0422 
0.1971 
0.4552 
0.7133 
0.8854 
0.9657 
0.9924 
0.9988 
0.9999 
1.0000 


0.0576 
0.2553 
0.5518 
0.8059 
0.9420 
0.9887 
0.9987 
0.9999 
1.0000 


0.0404 
0.1960 
0.4628 
0.7297 
0.9012 
0.9747 
0.9957 
0.9996 
1.0000 


0.0282 
0.1493 
0.3828 
0.6496 
0.8497 
0.9527 
0.9894 
0.9984 
0.9999 
1.0000 


0.0198 
0.1130 
0.3127 
0.5696 
0.7897 
0.9218 
0.9784 
0.9957 
0.9994 
1.0000 


0.0168 
0.1064 
0.3154 
0.5941 
0.8263 
0.9502 
0.9915 
0.9993 
1.0000 


0.0101 
0.0705 
0.2318 
0.4826 
0.7334 
0.9006 
0.9750 
0.9962 
0.9997 
1.0000 


0.0060 
0.0464 
0.1673 
0.3823 
0.6331 
0.8338 
0.9452 
0.9877 
0.9983 
0.9999 
1.0000 


0.0036 
0.0302 
0.1189 
0.2963 
0.5328 
0.7535 
0.9006 
0.9707 
0.9941 
0.9993 
1.0000 


0.0039 
0.0352 
0.1445 
0.3633 
0.6367 
0.8555 
0.9648 
0.9961 
1.0000 


0.0020 
0.0195 
0.0898 
0.2539 
0.5000 
0.7461 
0.9102 
0.9805 
0.9980 
1.0000 


0.0010 
0.0107 
0.0547 
0.1719 
0.3770 
0.6230 
0.8281 
0.9453 
0.9893 
0.9990 
1.0000 


0.0005 
0.0059 
0.0327 
0.1133 
0.2744 
0.5000 
0.7256 
0.8867 
0.9673 
0.9941 
0.9995 
1.0000 


0.0007 
0.0085 
0.0498 
0.1737 
0.4059 
0.6846 
0.8936 
0.9832 
1.0000 


0.0003 
0.0038 
0.0250 
0.0994 
0.2666 
0.5174 
0.7682 
0.9295 
0.9899 
1.0000 


0.0001 
0.0017 
0.0123 
0.0548 
0.1662 
0.3669 
0.6177 
0.8327 
0.9536 
0.9940 
1.0000 


0.0000 
0.0007 
0.0059 
0.0293 
0.0994 
0.2465 
0.4672 
0.7037 
0.8811 
0.9698 
0.9964 
1.0000 


0.0001 
0.0013 
0.0113 
0.0580 
0.1941 
0.4482 
0.7447 
0.9424 
1.0000 


0.0000 
0.0004 
0.0043 
0.0253 
0.0988 
0.2703 
0.5372 
0.8040 
0.9596 
1.0000 


0.0000 
0.0001 
0.0016 
0.0106 
0.0473 
0.1503 
0.3504 
0.6172 
0.8507 
0.9718 
1.0000 


0.0000 
0.0006 
0.0043 
0.0216 
0.0782 
0.2103 
0.4304 
0.6873 
0.8870 
0.9802 
1.0000 


0.0000 
0.0001 
0.0012 
0.0104 
0.0563 
0.2031 
0.4967 
0.8322 
1.0000 


0.0000 
0.0003 
0.0031 
0.0196 
0.0856 
0.2618 
0.5638 
0.8658 
1.0000 


0.0000 
0.0001 
0.0009 
0.0064 
0.0328 
0.1209 
0.3222 
0.6242 
0.8926 
1.0000 


0.0000 
0.0002 
0.0020 
0.0117 
0.0504 
0.1611 
0.3826 
0.6779 
0.9141 
1.0000 


0.0000 
0.0004 
0.0050 
0.0381 
0.1869 
0.5695 
1.0000 


0.0000 
0.0001 
0.0009 
0.0083 
0.0530 
0.2252 
0.6126 
1.0000 


0.0000 
0.0001 
0.0016 
0.0128 
0.0702 
0.2639 
0.6513 
1.0000 


0.0000 
0.0003 
0.0028 
0.0185 
0.0896 
0.3026 
0.6862 
1.0000 
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Tabla A.1 (continuación) Sumas de probabilidad binomial У ba; n, p) 


x=0 


р 
n r 0.10 0.20 0.25 0.30 0.40 0.50 0.60 0.70 0.80 0.90 
12 0 0.2824 0.0687 0.0317 0.0138 0.0022 0.0002 0.0000 
1 0.6590 0.2749 0.1584 0.0850 0.0196 0.0032 0.0003 0.0000 
2 0.8891 0.5583 0.3907 0.2528 0.0834 0.0193 0.0028 0.0002 0.0000 
3 0.9744 0.7946 0.6488 0.4925 0.2253 0.0730 0.0153 0.0017 0.0001 
4 0.9957 0.9274 0.8424 0.7237 0.4382 0.1938 0.0573 0.0095 0.0006 0.0000 
5 0.9995 0.9806 0.9456 0.8822 0.6652 0.3872 0.1582 0.0386 0.0039 0.0001 
6 0.9999 0.9961 0.9857 0.9614 0.8418 0.6128 0.3348 0.1178 0.0194 0.0005 
7 1.0000 0.9994 0.9972 0.9905 0.94277 0.8062 0.5618 0.2763 0.0726 0.0043 
8 0.9999 0.9996 0.9983 0.9847 0.9270 0.7747 0.5075 0.2054 0.0256 
9 1.0000 1.0000 0.9998 0.9972 0.9807 0.9166 0.7472 0.4417 0.1109 
10 1.0000 0.9997 0.9968 0.9804 0.9150 0.7251 0.3410 
11 1.0000 0.9998 0.9978 0.9862 0.9313 0.7176 
12 1.0000 1.0000 1.0000 1.0000 1.0000 
13 0 0.2542 0.0550 0.0238 0.0097 0.0013 0.0001 0.0000 
1 0.6213 0.2336 0.1267 0.0637 0.0126 0.0017 0.0001 0.0000 
2 0.8661 0.5017 0.3326 0.2025 0.0579 0.0112 0.0013 0.0001 
3 0.9658 0.7473 0.5843 0.4206 0.1686 0.0461 0.0078 0.0007 0.0000 
4 0.9935 0.9009 0.7940 0.6543 0.3530 0.1334 0.0321 0.0040 0.0002 
5 0.9991 0.9700 0.9198 0.8346 0.5744 0.2905 0.0977 0.0182 0.0012 0.0000 
6 0.9999 0.9930 0.9757 0.9376 0.7712 0.5000 0.2288 0.0624 0.0070 0.0001 
7 1.0000 0.9988 0.9944 0.9818 0.9023 0.7095 0.4256 0.1654 0.0300 0.0009 
8 0.9998 0.9990 0.9960 0.9679 0.8666 0.6470 0.3457 0.0991 0.0065 
9 1.0000 0.9999 0.9993 0.9922 0.9539 0.8314 0.5794 0.2527 0.0342 
10 1.0000 0.9999 0.9987 0.9888 0.9421 0.7975 0.4983 0.1339 
11 1.0000 0.9999 0.9983 0.9874 0.9363 07664 0.3787 
12 1.0000 0.9999 0.9987 0.9903 0.9450 0.7458 
13 1.0000 1.0000 1.0000 1.0000 1.0000 
14 0 0.2288 0.0440 0.0178 0.0068 0.0008 0.0001 0.0000 
1 0.5846 0.1979 0.1010 0.0475 0.0081 0.0009 0.0001 
2 0.8416 0.4481 0.2811 0.1608 0.0398 0.0065 0.0006 0.0000 
3 0.9559 0.6982 0.5213 0.3552 0.1243 0.0287 0.0039 0.0002 
4 0.9908 0.8702 0.7415 0.5842 0.2793 0.0898 0.0175 0.0017 0.0000 
5 0.9985 0.9561 0.8883 0.7805 0.4859 0.2120 0.0583 0.0083 0.0004 
6 0.9998 0.9884 0.9617 0.9067 0.6925 0.3953 0.1501 0.0315 0.0024 0.0000 
7 1.0000 0.9976 0.9897 0.9685 0.8499 0.6047 0.3075 0.0933 0.0116 0.0002 
8 0.9996 0.9978 0.9917 0.9417 0.7880 0.5141 0.2195 0.0439 0.0015 
9 1.0000 0.9997 0.9983 0.9825 0.9102 0.7207 0.4158 0.1298 0.0092 
10 1.0000 0.9998 0.9961 0.9713 0.8757 0.6448 0.3018 0.0441 
11 1.0000 0.9994 0.9935 0.9602 0.8392 0.5519 0.1584 
12 0.9999 0.9991 0.9919 0.9525 0.8021 0.4154 
13 1.0000 0.9999 0.9992 0.9932 0.9560 0.7712 


14 1.0000 1.0000 1.0000 1.0000 1.0000 
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р 
n r 0.10 0.20 0.25 0.30 0.40 0.50 0.60 0.70 0.80 0.90 
15 0 0.2059 0.0352 0.0134 0.0047 0.0005 0.0000 
1 0.5490 0.1671 0.0802 0.0353 0.0052 0.0005 0.0000 
2 0.8159 0.3980 0.2361 0.1268 0.0271 0.0037 0.0003 0.0000 
3 09444 0.6482 04613 0.2969 0.0905 0.0176 0.0019 0.0001 
4 09873 0.8358 0.6865 0.5155 0.2173 0.0592 0.0093 0.0007 0.0000 
5 0.9978 0.9389 08516 0.7216 04032 0.1509 0.0338 0.0037 0.0001 
6 0.9997 0.9819 0.9434 0.8689 0.6098 0.3036 0.0950 0.0152 0.0008 
7 1.0000 0.9958 0.9827 0.9500 0.7869 0.5000 0.2131 0.0500 0.0042 0.0000 
8 0.9992 0.9958 0.9848 0.9050 0.6964 0.3902 0.1311 0.0181 0.0003 
9 0.9999 0.9992 0.9963 0.9662 0.8491 0.5968 0.2784 0.0611 0.0022 
10 1.0000 0.9999 0.9993 0.9907 0.9408 0.78277 0.4845 0.1642 0.0127 
11 1.0000 0.9999 0.9981 0.9824 0.9095 0.7031 0.3518 0.0556 
12 1.0000 0.9997 0.9963 0.9729 0.8732 0.6020 0.1841 
13 1.0000 0.9995 0.9948 0.9647 0.8329 0.4510 
14 1.0000 0.9995 0.9953 0.9648 0.7941 
15 1.0000 1.0000 1.0000 1.0000 
16 0 0.1853 0.0281 0.0100 0.0033 0.0003 0.0000 
1 0.5147 0.1407 0.0635 0.0261 0.0033 0.0003 0.0000 
2 0.7892 0.3518 0.1971 0.0994 0.0183 0.0021 0.0001 
3 0.9316 0.5981 0.4050 0.2459 0.0651 0.0106 0.0009 0.0000 
4 0.9830 0.7982 0.6302 0.4499 0.1666 0.0384 0.0049 0.0003 
5 0.9967 0.9183 0.8103 0.6598 0.3288 0.1051 0.0191 0.0016 0.0000 
6 0.9995 0.9733 0.9204 0.8247 0.5272 0.2272 0.0583 0.0071 0.0002 
7 0.9999 0.9930 0.9729 0.9256 0.7161 0.4018 0.1423 0.0257 0.0015 0.0000 
8 1.0000 0.9985 0.9925 0.9743 0.8577 0.5982 0.2839 0.0744 0.0070 0.0001 
9 0.9998 0.9984 0.9929 0.9417 0.7728 0.4728 0.1753 0.0267 0.0005 
10 1.0000 0.9997 0.9984 0.9809 0.8949 0.6712 0.3402 0.0817 0.0033 
11 1.0000 0.9997 0.9951 0.9616 0.8334 0.5501 0.2018 0.0170 
12 1.0000 0.9991 0.9894 0.9349 0.7541 0.4019 0.0684 
13 0.9999 0.9979 0.9817 0.9006 0.6482 0.2108 
14 1.0000 0.9997 0.9967 0.9739 0.8593 0.4853 
15 1.0000 0.9997 0.9967 0.9719 0.8147 
16 1.0000 1.0000 1.0000 1.0000 
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Tabla A.1 (continuación) Sumas de probabilidad binomial У ba; n, p) 


x=0 


р 
n r 0.10 0.20 0.25 0.30 0.40 0.50 0.60 0.70 0.80 0.90 
17 0 0.1668 0.0225 0.0075 0.0023 0.0002 0.0000 

1 0.4818 0.1182 0.0501 0.0193 0.0021 0.0001 0.0000 

2 07618 0.3096 0.1637 0.0774 0.0123 0.0012 0.0001 

3 09174 0.5489 0.3530 0.2019 0.0464 0.0064 0.0005 0.0000 

4 0.9779 0.7582 0.5739 0.3887 0.1260 0.0245 0.0025 0.0001 

5 0.9953 0.8943 0.7653 0.5968 0.2639 0.0717 0.0106 0.0007 0.0000 

6 0.9992 0.9623 0.8929 0.7752 0.4478 0.1662 0.0348 0.0032 0.0001 

7 0.9999 0.9891 0.9598 0.8954 0.6405 0.3145 0.0919 0.0127 0.0005 

8 1.0000 0.9974 0.9876 0.9597 0.8011 0.5000 0.1989 0.0403 0.0026 0.0000 

9 0.9995 0.9969 0.9873 0.9081 0.6855 0.3595 0.1046 0.0109 0.0001 
10 0.9999 0.9994 0.9968 0.9652 0.8338 0.5522 0.2248 0.0377 0.0008 
1 1.0000 0.9999 0.9993 0.9894 0.9283 0.7361 0.4032 0.1057 0.0047 
12 1.0000 0.9999 0.9975 0.9755 0.8740 0.6113 0.2418 0.0221 
13 1.0000 0.9995 0.9936 0.9536 0.7981 0.4511 0.0826 
14 0.9999 0.9988 0.9877 0.9226 0.6904 0.2382 
15 1.0000 0.9999 0.9979 0.9807 0.8818 0.5182 
16 1.0000 0.9998 0.9977 0.9775 0.8332 
17 1.0000 1.0000 1.0000 1.0000 

18 0 0.1501 0.0180 0.0056 0.0016 0.0001 0.0000 

1 0.4503 0.0991 0.0395 0.0142 0.0013 0.0001 

2 0.7338 0.2713 0.1353 0.0600 0.0082 0.0007 0.0000 

3 0.9018 0.5010 0.3057 0.1646 0.0328 0.0038 0.0002 

4 0.9718 0.7164 0.5187 0.3327 0.0942 0.0154 0.0013 0.0000 

5 0.9936 0.8671 0.7175 0.5344 0.2088 0.0481 0.0058 0.0003 

6 0.9988 0.9487 0.8610 0.7217 0.3743 0.1189 0.0203 0.0014 0.0000 

7 0.9998 0.9837 0.9431 0.8593 0.5634 0.2403 0.0576 0.0061 0.0002 

8 1.0000 0.9957 0.9807 0.9404 0.7368 0.4073 0.1347 0.0210 0.0009 

9 0.9991 0.9946 0.9790 0.8653 0.5927 0.2632 0.0596 0.0043 0.0000 
10 0.9998 0.9988 0.9939 0.9424 0.7597 0.4366 0.1407 0.0163 0.0002 
11 1.0000 0.9998 0.9986 0.9797 0.8811 0.6257 0.2783 0.0513 0.0012 
12 1.0000 0.9997 0.9942 0.9519 0.7912 0.4656 0.1329 0.0064 
13 1.0000 0.9987 0.9846 0.9058 0.6673 0.2836 0.0282 
14 0.9998 0.9962 0.9672 0.8354 0.4990 0.0982 
15 1.0000 0.9993 0.9918 0.9400 0.7287 0.2662 
16 0.9999 0.9987 0.9858 0.9009 0.5497 
17 1.0000 0.9999 0.9984 0.9820 0.8499 


18 1.0000 1.0000 1.0000 1.0000 


Tabla A.1 Sumas de probabilidad binomial 


Tabla A.1 (continuación) Sumas de probabilidad binomial Y ba; 


x=0 


р 
n r 0.10 0.20 0.25 0.30 0.40 0.50 0.60 0.70 0.80 0.90 
19 0 0.1351 0.0144 0.0042 0.0011 0.0001 
1 04203 0.0829 0.0310 0.0104 0.0008 0.0000 
2 07054 0.2369 01113 0.0462 0.0055 0.0004 0.0000 
3 0.8850 0.4551 0.2631 0.1332 0.0230 0.0022 0.0001 
4 0.9648 0.6733 0.4654 0.2822 0.0696 0.0096 0.0006 0.0000 
5 0.9914 0.8369 0.6678 0.4739 0.1629 0.0318 0.0031 0.0001 
6 0.9983 0.9324 0.8251 0.6655 0.3081 0.0835 0.0116 0.0006 
7 0.9997 0.9767 0.9225 0.8180 0.4878 0.1796 0.0352 0.0028 0.0000 
8 1.0000 0.9933 0.9713 0.9161 0.6675 0.3238 0.0885 0.0105 0.0003 
9 0.9984 0.9911 0.9674 0.8139 0.5000 0.1861 0.0326 0.0016 
10 0.9997 0.9977 0.9895 0.9115 0.6762 0.3325 0.0839 0.0067 0.0000 
11 1.0000 0.9995 0.9972 0.9648 0.8204 0.5122 0.1820 0.0233 0.0003 
12 0.9999 0.9994 0.9884 0.9165 0.6919 0.3345 0.0676 0.0017 
13 1.0000 0.9999 0.9969 0.9682 0.8371 0.5261 0.1631 0.0086 
14 1.0000 0.9994 0.9904 0.9304 0.7178 0.3267 0.0352 
15 0.9999 0.9978 0.9770 0.8668 0.5449 0.1150 
16 1.0000 0.9996 0.9945 0.9538 0.7631 0.2946 
17 1.0000 0.9992 0.9896 0.9171 0.5797 
18 0.9999 0.9989 0.9856 0.8649 
19 1.0000 1.0000 1.0000 1.0000 
20 0 0.1216 0.0115 0.0032 0.0008 0.0000 
1 0.3917 0.0692 0.0243 0.0076 0.0005 0.0000 
2 0.6769 0.2061 0.0913 0.0355 0.0036 0.0002 
3 0.8670 0.4114 0.2252 0.1071 0.0160 0.0013 0.0000 
4 0.9568 0.6296 0.4148 0.2375 0.0510 0.0059 0.0003 
5 0.9887 0.8042 0.6172 0.4164 0.1256 0.0207 0.0016 0.0000 
6 0.9976 0.9133 0.7858 0.6080 0.2500 0.0577 0.0065 0.0003 
7 0.9996 0.9679 0.8982 0.7723 0.4159 0.1316 0.0210 0.0013 0.0000 
8 0.9999 0.9900 0.9591 0.8867 0.5956 0.2517 0.0565 0.0051 0.0001 
9 1.0000 0.9974 0.9861 0.9520 0.7553 0.4119 0.1275 0.0171 0.0006 
10 0.9994 0.9961 0.9829 0.8725 0.5881 0.2447 0.0480 0.0026 0.0000 
11 0.9999 0.9991 0.9949 0.9435 0.7483 0.4044 0.1133 0.0100 0.0001 
12 1.0000 0.9998 0.9987 0.9790 0.8684 0.5841 0.2277 0.0321 0.0004 
13 1.0000 0.9997 0.9935 0.9423 0.7500 0.3920 0.0867 0.0024 
14 1.0000 0.9984 0.9793 0.8744 0.5836 0.1958 0.0113 
15 0.9997 0.9941 0.9490 0.7625 0.3704 0.0432 
16 1.0000 0.9987 0.9840 0.8929 0.5886 0.1330 
17 0.9998 0.9964 0.9645 0.7939 0.3231 
18 1.0000 0.9995 0.9924 0.9308 0.6083 
19 1.0000 0.9992 0.9885 0.8784 
20 1.0000 1.0000 1.0000 
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Tabla A.2 Sumas de probabilidad de Poisson у p(x; H) 


x=0 


r 0.1 0.2 0.30 0.4 0.5 0.6 0.7 0.8 0.9 
0 0.9048 0.8187 0.7408 0.6703 0.6065 0.5488 0.4966 0.4493 0.4066 
1 0.9953 0.9825 0.9631 0.9384 0.9098 0.8781 0.8442 0.8088 0.7725 
2 0.9998 0.9989 0.9964 0.9921 0.9856 0.9769 0.9659 0.9526 0.9371 
3 1.0000 0.9999 0.9997 0.9992 0.9982 0.9966 0.9942 0.9909 0.9865 
4 1.0000 1.0000 0.9999 0.9998 0.9996 0.9992 0.9986 0.9977 
5 1.0000 1.0000 1.0000 0.9999 0.9998 0.9997 
6 1.0000 1.0000 1.0000 
r 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 
0 0.3679 0.2231 0.1353 0.0821 0.0498 0.0302 0.0183 0.0111 0.0067 
1 0.7358 0.5578 0.4060 0.2873 0.1991 0.1359 0.0916 0.0611 0.0404 
2 0.9197 0.8088 0.6767 0.5438 0.4232 0.3208 0.2381 0.1736 0.1247 
3 0.9810 0.9344 0.8571 0.7576 0.6472 0.5366 0.4335 0.3423 0.2650 
4 0.9963 0.9814 0.9473 0.8912 0.8153 0.7254 0.6288 0.5321 0.4405 
5 0.9994 0.9955 0.9834 0.9580 0.9161 0.8576 0.7851 0.7029 0.6160 
6 0.9999 0.9991 0.9955 0.9858 0.9665 0.9347 0.8893 0.8311 0.7622 
7 1.0000 0.9998 0.9989 0.9958 0.9881 0.9733 0.9489 0.9134 0.8666 
8 1.0000 0.9998 0.9989 0.9962 0.9901 0.9786 0.9597 0.9319 
9 1.0000 0.9997 0.9989 0.9967 0.9919 0.9829 0.9682 
10 0.9999 0.9997 0.9990 0.9972 0.9933 0.9863 
11 1.0000 0.9999 0.9997 0.9991 0.9976 0.9945 
12 1.0000 0.9999 0.9997 0.9992 0.9980 
13 1.0000 0.9999 0.9997 0.9993 
14 1.0000 0.9999 0.9998 
15 1.0000 0.9999 
16 1.0000 


Tabla A.2 Sumas de probabilidad de Poisson 


Tabla A.2 (continuación) Sumas de probabilidad de Poisson у р(х; Ш) 


х=0 
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r 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 
0 0.0041 0.0025 0.0015 0.0009 0.0006 0.0003 0.0002 0.0001 0.0001 
1 0.0266 0.0174 0.0113 0.0073 0.0047 0.0030 0.0019 0.0012 0.0008 
2 0.0884 0.0620 0.0430 0.0296 0.0203 0.0138 0.0093 0.0062 0.0042 
3 0.2017 0.1512 0.1118 0.0818 0.0591 0.0424 0.0301 0.0212 0.0149 
4 0.3575 0.2851 0.2237 0.1730 0.1321 0.0996 0.0744 0.0550 0.0403 
5 0.5289 0.4457 0.3690 0.3007 0.2414 0.1912 0.1496 0.1157 0.0885 
6 0.6860 0.6063 0.5265 0.4497 0.3782 0.3134 0.2562 0.2068 0.1649 
7 0.8095 0.7440 0.6728 0.5987 0.5246 0.4530 0.3856 0.3239 0.2687 
8 0.8944 0.8472 0.7916 0.7291 0.6620 0.5925 0.5231 0.4557 0.3918 
9 0.9462 0.9161 0.8774 0.8305 0.7764 0.7166 0.6530 0.5874 0.5218 
10 0.9747 0.9574 0.9332 0.9015 0.8622 0.8159 0.7634 0.7060 0.6453 
11 0.9890 0.9799 0.9661 0.9467 0.9208 0.8881 0.8487 0.8030 0.7520 
12 0.9955 0.9912 0.9840 0.9730 0.9573 0.9362 0.9091 0.8758 0.8364 
13 0.9983 0.9964 0.9929 0.9872 0.9784 0.9658 0.9486 0.9261 0.8981 
14 0.9994 0.9986 0.9970 0.9943 0.9897 0.9827 0.9726 0.9585 0.9400 
15 0.9998 0.9995 0.9988 0.9976 0.9954 0.9918 0.9862 0.9780 0.9665 
16 0.9999 0.9998 0.9996 0.9990 0.9980 0.9963 0.9934 0.9889 0.9823 
17 1.0000 0.9999 0.9998 0.9996 0.9992 0.9984 0.9970 0.9947 0.9911 
18 1.0000 0.9999 0.9999 0.9997 0.9993 0.9987 0.9976 0.9957 
19 1.0000 1.0000 0.9999 0.9997 0.9995 0.9989 0.9980 
20 0.9999 0.9998 0.9996 0.9991 
21 1.0000 0.9999 0.9998 0.9996 
22 1.0000 0.9999 0.9999 
23 1.0000 0.9999 
24 1.0000 
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Tabla A.2 (continuación) Sumas de probabilidad de Poisson у р(х; Ш) 


х= 0 


r 10.0 11.0 12.0 13.0 14.0 15.0 16.0 17.0 18.0 

0 0.0000 0.0000 0.0000 

1 0.0005 0.0002 0.0001 0.0000 0.0000 

2 0.0028 0.0012 0.0005 0.0002 0.0001 0.0000 0.0000 

3 0.0103 0.0049 0.0023 0.0011 0.0005 0.0002 0.0001 0.0000 0.0000 

4 0.0293 0.0151 0.0076 0.0037 0.0018 0.0009 0.0004 0.0002 0.0001 

5 0.0671 0.0375 0.0203 0.0107 0.0055 0.0028 0.0014 0.0007 0.0003 

6 0.1301 0.0786 0.0458 0.0259 0.0142 0.0076 0.0040 0.0021 0.0010 

7 0.2202 0.1432 0.0895 0.0540 0.0316 0.0180 0.0100 0.0054 0.0029 

8 0.3328 0.2320 0.1550 0.0998 0.0621 0.0374 0.0220 0.0126 0.0071 

9 0.4579 0.3405 0.2424 0.1658 0.1094 0.0699 0.0433 0.0261 0.0154 
10 0.5830 0.4599 0.3472 0.2517 0.1757 0.1185 0.0774 0.0491 0.0304 
11 0.6968 0.5793 0.4616 0.3532 0.2600 0.1848 0.1270 0.0847 0.0549 
12 0.7916 0.6887 0.5760 0.4631 0.3585 0.2676 0.1931 0.1350 0.0917 
13 0.8645 0.7813 0.6815 0.5730 0.4644 0.3632 0.2745 0.2009 0.1426 
14 0.9165 0.8540 0.7720 0.6751 0.5704 0.4657 0.3675 0.2808 0.2081 
15 0.9513 0.9074 0.8444 0.7636 0.6694 0.5681 0.4667 0.3715 0.2867 
16 0.9730 0.9441 0.8987 0.8355 0.7559 0.6641 0.5660 0.4677 0.3751 
17 0.9857 0.9678 0.9370 0.8905 0.8272 0.7489 0.6593 0.5640 0.4686 
18 0.9928 0.9823 0.9626 0.9302 0.8826 0.8195 0.7423 0.6550 0.5622 
19 0.9965 0.9907 0.9787 0.9573 0.9235 0.8752 0.8122 0.7363 0.6509 
20 0.9984 0.9953 0.9884 0.9750 0.9521 0.9170 0.8682 0.8055 0.7307 
21 0.9993 0.9977 0.9939 0.9859 0.9712 0.9469 0.9108 0.8615 0.7991 
22 0.9997 0.9990 0.9970 0.9924 0.9833 0.9673 0.9418 0.9047 0.8551 
23 0.9999 0.9995 0.9985 0.9960 0.9907 0.9805 0.9633 0.9367 0.8989 
24 1.0000 0.9998 0.9993 0.9980 0.9950 0.9888 0.9777 0.9594 0.9317 
25 0.9999 0.9997 0.9990 0.9974 0.9938 0.9869 0.9748 0.9554 
26 1.0000 0.9999 0.9995 0.9987 0.9967 0.9925 0.9848 0.9718 
27 0.9999 0.9998 0.9994 0.9983 0.9959 0.9912 0.9827 
28 1.0000 0.9999 0.9997 0.9991 0.9978 0.9950 0.9897 
29 1.0000 0.9999 0.9996 0.9989 0.9973 0.9941 
30 0.9999 0.9998 0.9994 0.9986 0.9967 
31 1.0000 0.9999 0.9997 0.9993 0.9982 
32 1.0000 0.9999 0.9996 0.9990 
33 0.9999 0.9998 0.9995 
34 1.0000 0.9999 0.9998 
35 1.0000 0.9999 
36 0.9999 
37 1.0000 


Tabla A.3 Áreas bajo la curva normal 
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1 
| 
Tabla A.3 Áreas bajo la curva normal HA 
2 .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 

—3.4 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0002 
—3.3 0.0005 0.0005 0.0005 0.0004 0.0004 0.0004 0.0004 0.0004 0.0004 0.0003 
—3.2 0.0007 0.0007 0.0006 0.0006 0.0006 0.0006 0.0006 0.0005 0.0005 0.0005 
—3.1 0.0010 0.0009 0.0009 0.0009 0.0008 0.0008 0.0008 0.0008 0.0007 0.0007 
—3.0 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.0011 0.0011 0.0010 0.0010 
—2.9 0.0019 0.0018 0.0018 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014 
—2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019 
—2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026 
—2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036 
—2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048 
—2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064 
—2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084 
—2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110 
—2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143 
—2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183 
—1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233 
—1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294 
—1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367 
—1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455 
—1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559 
—1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681 
—1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823 
—1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985 
—1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170 
—1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379 
—0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611 
—0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867 
—0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148 
—0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451 
—0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776 
—0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121 
—0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483 
—0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859 
—0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247 
—0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641 
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Tabla A.3 (continuación) Areas bajo la curva normal 


2 .00 01 02 03 04 05 06 07 .08 09 


0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359 
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141 
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517 
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879 


0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224 
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549 
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389 


1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621 
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830 
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015 
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177 
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319 


1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441 
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545 
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633 
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706 
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767 


2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817 
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857 
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890 
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916 
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936 


2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952 
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964 
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974 
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981 
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986 


3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990 
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993 
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995 
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997 
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998 
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Tabla A.4 Valores críticos de la distribución t 1% 

v 0.40 0.30 0.20 0.15 0.10 0.05 0.025 
1 0.325 0.727 1.376 1.963 3.078 6.314 12.706 
2 0.289 0.617 1.061 1.386 1.886 2.920 4.303 
3 0.277 0.584 0.978 1.250 1.638 2.353 3.182 
4 0.271 0.569 0.941 1.190 1.533 2.132 2.776 
5 0.267 0.559 0.920 1.156 1.476 2.015 2.571 
6 0.265 0.553 0.906 1.134 1.440 1.943 2.447 
7 0.263 0.549 0.896 1.119 1415 1.895 2.365 
8 0.262 0.546 0.889 1.108 1.397 1.860 2.306 
9 0.261 0.543 0.883 1.100 1.383 1.833 2.262 
10 0.260 0.542 0.879 1.093 1.372 1.812 2.228 
11 0.260 0.540 0.876 1.088 1.363 1.796 2.201 
12 0.259 0.539 0.873 1.083 1.356 1.782 2.179 
13 0.259 0.538 0.870 1.079 1.350 1.771 2.160 
14 0.258 0.537 0.868 1.076 1.345 1.761 2.145 
15 0.258 0.536 0.866 1.074 1.341 1.753 2.131 
16 0.258 0.535 0.865 1.071 1:337 1.746 2.120 
17 0.257 0.534 0.863 1.069 1:333 1.740 2.110 
18 0.257 0.534 0.862 1.067 1.330 1.734 2.101 
19 0.257 0.533 0.861 1.066 1.328 1.729 2.093 
20 0.257 0.533 0.860 1.064 1.325 1.725 2.086 
21 0.257 0.532 0.859 1.063 1.323 1.721 2.080 
22 0.256 0.532 0.858 1.061 1.321 1.717 2.074 
23 0.256 0.532 0.858 1.060 1.319 1.714 2.069 
24 0.256 0.531 0.857 1.059 1.318 1.711 2.064 
25 0.256 0.531 0.856 1.058 1.316 1.708 2.060 
26 0.256 0.531 0.856 1.058 1.315 1.706 2.056 
27 0.256 0.531 0.855 1.057 1.314 1.703 2.052 
28 0.256 0.530 0.855 1.056 1.313 1.701 2.048 
29 0.256 0.530 0.854 1.055 1.311 1.699 2.045 
30 0.256 0.530 0.854 1.055 1.310 1.697 2.042 
40 0.255 0.529 0.851 1.050 1.303 1.684 2.021 
60 0.254 0.527 0.848 1.045 1.296 1.671 2.000 
120 0.254 0.526 0.845 1.041 1.289 1.658 1.980 
со 0.253 0.524 0.842 1.036 1.282 1.645 1.960 
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Tabla A.4 (continuación) Valores críticos de la distribución t 


Q 

v 0.02 0.015 0.01 0.0075 0.005 0.0025 0.0005 
1 15.894 21.205 31.821 42.433 63.656 127.321 636.578 
2 4.849 5.643 6.965 8.073 9.925 14.089 31.600 
3 3.482 3.896 4.541 5.047 5.841 7.453 12.924 
4 2.999 3.298 3.747 4.088 4.604 5.598 8.610 
5 2.757 3.003 3.365 3.634 4.032 4.773 6.869 
6 2.612 2.829 3.143 3.372 3.707 4.317 5.959 
7 2.517 2.715 2.998 3.203 3.499 4.029 5.408 
8 2.449 2.634 2.896 3.085 3.355 3.833 5.041 
9 2.398 2.574 2.821 2.998 3.250 3.690 4.781 
10 2.359 2.527 2.764 2.932 3.169 3.581 4.587 
11 2.328 2.491 2.718 2.879 3.106 3.497 4,437 
12 2.303 2.461 2.681 2.836 3.055 3.428 4.318 
13 2.282 2.436 2.650 2.801 3.012 3.372 4,221 
14 2.264 2.415 2.624 2.771 2.977 3.326 4.140 
15 2.249 2.397 2.602 2.746 2.947 3.286 4.073 
16 2.235 2.382 2.583 2.724 2.921 3.252 4.015 
17 2.224 2.368 2.567 2.706 2.898 3.222 3.965 
18 2.214 2.356 2.552 2.689 2.878 3.197 3.922 
19 2.205 2.346 2.539 2.674 2.861 3.174 3.883 
20 2.197 2.336 2.528 2.661 2.845 3.153 3.850 
21 2.189 2.328 2.518 2.649 2.831 3.135 3.819 
22 2.183 2.320 2.508 2.639 2.819 3.119 3.792 
23 20177. 2.313 2.500 2.629 2.807 3.104 3.768 
24 2.172 2.307 2.492 2.620 2.797 3.091 3.745 
25 2.167 2.301 2.485 2.612 2.787 3.078 3.725 
26 2.162 2.296 2.479 2.605 2.779 3.067 3.707 
27 2.158 2.291 2.473 2.598 2771 3.057 3.689 
28 2.154 2.286 2.467 2.592 2.763 3.047 3.674 
29 2.150 2.282 2.462 2.586 2.756 3.038 3.660 
30 2.147 2.278 2.457 2.581 2.750 3.030 3.646 
40 2.123 2.250 2.423 2.542 2.704 2.971 3.551 
60 2.099 2.223 2.390 2.504 2.660 2.915 3.460 
120 2.076 2.196 2.358 2.468 2.617 2.860 3.373 


оо 2.054 2.170 2.326 2.432 2.576 2.807 3.290 


Tabla A.5 Valores críticos de la distribución chi cuadrada 
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Tabla А.5 Valores críticos de la distribución chi cuadrada 0 Xi 
Q 
v 0.995 0.99 0.98 0.975 0.95 0.90 0.80 0.75 0.70 0.50 
1 0.0*393 0.0°157 0.09628 0.0982 0.00393 0.0158 0.0642 0.102 0.148 0.455 
2 0.0100 0.0201 0.0404 0.0506 0.103 0.211 0.446 0.575 0.713 1.386 
3 0.0717 0.115 0.185 0.216 0.352 0.584 1.005 1.213 1.424 2.366 
4 0.207 0.297 0.429 0.484 0.711 1.064 1.649 1.923 2.195 3.357 
5 0.412 0.554 0.752 0.831 1.145 1.610 2.343 2.675 3.000 4.351 
6 0.676 0.872 1.134 1:237 1.635 2.204 3.070 3.455 3.828 5.348 
7 0.989 1.239 1.564 1.690 2.167 2.833 3.822 4.255 4.671 6.346 
8 1.344 1.647 2.032 2.180 2.733 3.490 4.594 5.071 5.527 7.344 
9 1.735 2.088 2.532 2.700 3.325 4.168 5.380 5.899 6.393 8.343 
10 2.156 2.558 3.059 3.247 3.940 4.865 6.179 6.737 7.267 9.342 
11 2.603 3.053 3.609 3.816 4.575 5.578 6.989 7.584 8.148 10.341 
12 3.074 3.571 4.178 4.404 5.226 6.304 7.807 8.438 9.034 11.340 
13 3.565 4.107 4.765 5.009 5.892 7.041 8.634 9.299 9.926 12.340 
14 4.075 4.660 5.368 5.629 6.571 7.790 9.467 10.165 10.821 13.339 
15 4.601 5.229 5.985 6.262 7.261 8.547 10.307 11.037 11.721 14.339 
16 5.142 5.812 6.614 6.908 7.962 9.312 11.152 11.912 12.624 15.338 
17 5.697 6.408 7.255 7.564 8.672 10.085 12.002 12.792 13.531 16.338 
18 6.265 7.015 7.906 8.231 9.390 10.865 12.857 13.675 14.440 17.338 
19 6.844 7.633 8.567 8.907 10.117 11.651 13.716 14.562 15.352 18.338 
20 7.434 8.260 9.237 9.591 10.851 12.443 14.578 15.452 16.266 19.337 
21 8.034 8.897 9.915 10.283 11.591 13.240 15.445 16.344 17.182 20.337 
22 8.643 9.542 10.600 10.982 12.338 14.041 16.314 17.240 18.101 21.337 
23 9.260 10.196 11.293 11.689 13.091 14.848 17.187 18.137 19.021 22.337 
24 9.886 10.856 11.992 12.401 13.848 15.659 18.062 19.037 19.943 23.337 
25 10.520 11.524 12.697 13.120 14.611 16.473 18.940 19.939 20.867 24.337 
26 11.160 12.198 13.409 13.844 15.379 17.292 19.820 20.843 21.792 25.336 
27 11.808 12.878 14.125 14.573 16.151 18.114 20.703 21.749 22.719 26.336 
28 12.461 13.565 14.847 15.308 16.928 18.939 21.588 22.657 23.647 27.336 
29 13.121 14.256 15.574 16.047 17.708 19.768 22.475 23.567 24.577 28.336 
30 13.787 14.953 16.306 16.791 18.493 20.599 23.364 24.478 25.508 29.336 
40 20.707 22.164 23.838 24.433 26.509 29.051 32.345 33.66 34.872 39.335 
50 27.991 29.707 31.664 32.357 34.764 37.689 41.449 42.942 44.313 49.335 
60 35.534 37.485 39.699 40.482 43.188 46.459 50.641 52.294 53.809 59.335 
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Tabla A.5 (continuación) Valores críticos de la distribución chi cuadrada 


а 
0.30 0.25 0.20 0.10 0.05 0.025 0.02 0.01 0.005 0.001 


= 


1 1.074 1.323 1.642 2.706 3.841 5.024 5.412 6.635 7.879 10.827 
2 2.408 2.773 3.219 4.605 5.991 7.378 7.824 9.210 10.597 13.815 
3 3.665 4.108 4.642 6.251 7.815 9.348 9.837 11.345 12.838 16.266 
4 4.878 5.385 5.989 7779 9.488 11.143 11.668 13.277 14.860 18.466 
5 6.064 6.626 7.289 9.236 11.070 12.832 13.388 15.086 16.750 20.515 
6 7.231 7.841 8.558 10.645 12.592 14.449 15.033 16.812 18.548 22.457 
7 8.383 9.037 9.803 12.017 14.067 16.013 16.622 18.475 20.278 24.321 
8 9.524 10.219 11.030 13.362 15.507 17.535 18.168 20.090 21.955 26.124 
9 10.656 11.389 12.242 14.684 16.919 19.023 19.679 21.666 23.589 27.877 
10 11.781 12.549 13.442 15.987 18.307 20.483 21.161 23.209 25.188 29.588 
11 12.899 13.701 14.631 17.275 19.675 21.920 22.618 24.725 26.757 31.264 


12 14.011 14.845 15.812 18.549 21.026 23.337 24.054 26.217 28.300 32.909 
13 15.119 15.984 16.985 19.812 22.362 24.736 25.471 27.688 29.819 34.527 
14 16.222 17.117 18.151 21.064 23.685 26.119 26.873 29.141 31.319 36.124 
15 17.322 18.245 19.311 22.307 24.996 27.488 28.259 30.578 32.801 37.698 


16 18.418 19.369 20.465 23.542 26.296 28.845 29.633 32.000 34.267 39.252 
17 19.511 20.489 21.615 24.769 27.587 30.191 30.995 33.409 35.718 40.791 
18 20.601 21.605 22.760 25.989 28.869 31.526 32.346 34.805 37.156 42.312 
19 21.689 22.718 23.900 27.204 30.144 32.852 33.687 36.191 38.582 43.819 
20 22.775 23.828 25.038 28.412 31.410 34.170 35.020 37.566 39.997 45.314 


21 23.858 24.935 26.171 29.615 32.671 35.479 36.343 38.932 41.401 46.796 
22 24.939 26.039 27.301 30.813 33.924 36.781 37.659 40.289 42.796 148.268 
23 26.018 27.141 28.429 32.007 35.172 38.076 38.968 41.638 44.181 149.728 
24 27.096 28.241 29.553 33.196 36.415 39.364 40.270 42.980 45.558 51.179 
25 28.172 29.339 30.675 34.382 37.652 40.646 41.566 44.314 46.928 52.619 


26 29.246 30.435 31.795 35.563 38.885 41.923 42.856 45.642 48.290 54.051 
27 30.319 31.528 32.912 36.741 40.113 43.195 44.140 46.963 49.645 55.475 
28 31.391 32.620 34.027 37.916 41.337 44.461 45.419 48.278 50.994 56.892 
29 32.461 33.711 35.139 39.087 42.557 45.722 46.693 49.588 52.335 58.301 
30 33.530 34.800 36.250 40.256 43.773 46.979 47.962 50.892 53.672 59.702 


40 44.165 45.616 47.269 51.805 55.758 59.342 60.436 63.691 66.766 73.403 
50 54.723 56.334 58.164 63.167 67.505 71.420 72.613 76.154 79.490 86.660 
60 65.226 66.981 68.972 74.397 79.082 83.298 84.58 88.379 91.952 99.608 
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Q 
Tabla A.6 Valores críticos de la distribución F 0 fa 
ЛО» v,) 
Y, 

у, 1 2 3 4 5 6 7 8 9 
1 161.45 199.50 215.71 224.58 230.16 233.99 236.77 238.88 240.54 
2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 
3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 
4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 
5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 
6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 
8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 
10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 
11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 
12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 
13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 
14 4.60 3.74 3.34 gli 2.96 2.85 2.76 2.70 2.65 
15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 
16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 
17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 
18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 
19 4.38 3.52 3.13 2.90 2.74 2.63 2,54 2.48 2.42 
20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 
21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 
22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 
23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 
24 4.26 3.40 3.01 2.78 2.62 2.31 2.42 2.36 2.30 
25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 
26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 
27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 
28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 
29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22 
30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 
40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 
60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 
120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96 
оо 3.84 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88 


Reproducida de la tabla 18 de Biometrika Tables for Statisticians, Vol. I, con autorización de E.S. Pearson 
y Biometrika Trustees. 


742 Apéndice A Tablas y demostraciones estadísticas 


Tabla A.6 (continuación) Valores críticos de la distribución F 


too Vi у) 
Vi 
у, 10 12 15 20 24 30 40 60 120 оо 
1 241.88 243.91 245.95 248.01 249.05 250.10 251.14 252.20 253.25 254.31 
2 19.40 19.41 19.43 19.45 19.45 19.46 19.47 19.48 19.49 19.50 
3 8.79 8.74 8.70 8.66 8.64 8.62 8.59 8.57 8.55 8.53 
4 5.96 5.91 5.86 5.80 5.77 5.73 5.72 5.69 5.66 5.63 
5 4.74 4.68 4.62 4.56 4.53 4.50 4.46 4.43 4.40 4.36 
6 4.06 4.00 3.94 3.87 3.84 3.81 3.77 3.74 3.70 3.67 
7 3.64 3.97 3.51 3.44 3.41 3.38 3.34 3.30 3.27 3.23 
8 3.35 3.28 3.22 3.13 3.12 3.08 3.04 3.01 2.97 2.93 
9 3.14 3.07 3.01 2.94 2.90 2.86 2.83 2.19 2.75 2.71 
10 2.98 2.91 2.85 2.17 2.74 2.70 2.66 2.62 2.58 2.54 
11 2.85 2.79 2.72 2.65 2.61 2.57 2.53 2.49 2.45 2.40 


12 2:19 2.69 2.62 2.54 2.51 2.47 2.43 2.38 2.34 2.30 
13 2.67 2.60 2.53 2.46 2.42 2.38 2.34 2.30 2.25 2.21 
14 2.60 2.53 2.46 2.39 2.35 2.31 2.27 2.22 2.18 2.13 
15 2.54 2.48 2.40 2.33 2.29 2.25 2.20 2.16 2.11 2.07 


16 2.49 2.42 2.35 2.28 2.24 2.19 2.15 2.11 2.06 2.01 
17 2.45 2.38 2.31 2.23 2.19 2.15 2.10 2.06 2.01 1.96 
18 2.41 2.34 2.27 2.19 2.15 2.11 2.06 2.02 1.97 1.92 
19 2.38 2.31 2.23 2.16 2.11 2.07 2.03 1.98 1.93 1.88 
20 2.35 2.28 2.20 2.12 2.08 2.04 1.99 1.95 1.90 1.84 


21 2.32 2.25 2.18 2.10 2.05 2.01 1.96 1.92 1.87 1.81 
22 2.30 2.23 2.15 2.07 2.03 1.98 1.94 1.89 1.84 1.78 
23 2.27 2.20 2.13 2.05 2.01 1.96 1.91 1.86 1.81 1.76 
24 2.25 2.18 2.11 2.03 1.98 1.94 1.89 1.84 1.79 1.73 
25 2.24 2.16 2.09 2.01 1.96 1.92 1.87 1.82 1.77 1.71 


26 2.22 2.15 2.07 1.99 1.95 1.90 1.85 1.80 1.75 1.69 
27 2.20 2:13 2.06 1.97 1.93 1.88 1.84 1.79 1.73 1.67 
28 2.19 2.12 2.04 1.96 1.91 1.87 1.82 1.77 1.71 1.65 
29 2.18 2.10 2.03 1.94 1.90 1.85 1.81 1.75 1.70 1.64 
30 2.16 2.09 2.01 1.93 1.89 1.84 1.79 1.74 1.68 1.62 


40 2.08 2.00 1.92 1.84 1.79 1.74 1.69 1.64 1.58 1.51 
60 1.99 1.92 1.84 1.75 1.70 1.65 1.59 1.53 1.47 1.39 
120 1.91 1.83 1.75 1.66 1.61 1.55 1.50 1.43 1.35 1,23 
со 1.83 1.75 1.67 1.57 1.52 1.46 1.39 1.32 1.22 1.00 
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Tabla А.б (continuación) Valores críticos de la distribución F 


Жа” Y) 


Vi 


v 1 2 3 4 5 6 7 8 9 


1 4052.18 4999.50 5403.35 5624.58 5763.65 5858.99 5928.36 5981.07 6022.47 
2 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39 
3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35 
4 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 
5 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 
6 
7 
8 


13:79 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 

12:25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 

11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 

9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 9.35 
10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 
11 9.65 721 6.22 5.67 5.32 5.07 4.89 4.74 4.63 
12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 
13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 
14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 
15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 
16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 
17 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68 
18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 
19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 
20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 
21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40 
22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 
23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30 
24 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 
25 777 5:57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 
26 772 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18 
27 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15 
28 7.64 5.45 4.57 4.07 3.75 3.93 3.36 3.23 3.12 
29 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09 
30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 
40 7.31 5.18 4.31 3.83 3:51 3,29 3.12 2.99 2.89 
60 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 
120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 


со 6.63 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41 


744 Apéndice A Tablas y demostraciones estadísticas 


Tabla A.6 (continuación) Valores críticos de la distribución F 


Loy А) 
Vi 
», 10 12 15 20 24 30 40 60 120 оо 
1 6055.85 6106.32 6157.28 6208.73 6234.63 6260.65 6286.78 6313.03 6339.39 6365.86 
2 9940 99.42 99.43 99.45 99.46 99.47 99.47 99.48 99.49 99.50 
3 2723 27.05 26.87 26.69 26.60 26.50 26.41 26.32 26.22 26.13 
4 14.55 14.37 14.20 14.02 13.93 13.84 13.75 13.65 13.56 13.46 
5 10.05 9.89 9.72 9.55 9.47 9.38 9.29 9.20 9.11 9.02 
6 7.87 772 7.56 7.40 7.31 7:29 7.14 7.06 6.97 6.88 
7 6.62 6.47 6.31 6.16 6.07 5.99 5.91 5.82 5.74 5.65 
8 5.81 5.67 9.92 5.36 5.28 5.20 5.12 5.03 4.95 4.86 
9 5.26 5.11 4.96 4.81 4.73 4.65 4.57 4.48 4.40 4.31 
10 4.85 4.71 4.56 4.41 4.33 4.25 417 4.08 4.00 3.91 
11 4.54 4.40 4.25 4.10 4.02 3.94 3.86 3.78 3.69 3.60 


12 4.30 4.16 4.01 3.86 3.78 3.70 3.62 3.54 3.45 3.36 
13 4.10 3.96 3.82 3.66 3:39 3.51 3.43 3.34 3.25 3:17 
14 3.94 3.80 3.66 3.51 3.43 зә 3.27 3.18 3.09 3.00 
15 3.80 3.67 3.52 3.37 3.29 3:21 3.13 3.05 2.96 2.87 


16 3.69 3:39 3.41 3.26 3.18 3.10 3.02 2.93 2.84 275 
17 3.59 3.46 Sl 3.16 3.08 3.00 2.92 2.83 2.75 2.65 
18 301 3.37 3.23 3.08 3.00 2.92 2.84 2.79 2.66 2.57 
19 3.43 3.30 3.15 3.00 2.92 2.84 2.76 2.67 2.58 2.49 
20 3.37 3.23 3.09 2.94 2.86 2.78 2.69 2.61 2.52 2.42 


21 3.31 3.17 3.03 2.88 2.80 2.72 2.64 2.55 2.46 2.36 
22 3.26 3.12 2.98 2.83 2.75 2.67 2.58 2.50 2.40 2.31 
23 3.21 3.07 2.93 2.78 2.70 2.62 2.54 2.45 2.35 2.26 
24 3.17 3.03 2.89 2.74 2.66 2.58 2.49 2.40 2.31 2.21 
25 3.13 2.99 2.85 2.70 2.62 2.54 2.45 2.36 2.27 2.17 


26 3.09 2.96 2.81 2.66 2.58 2.50 2.42 2.33 2,23 2.13 
27 3.06 2.93 2.78 2.63 2.55 2.47 2.38 2.29 2.20 2.10 
28 3.03 2.90 275 2.60 2.52 2.44 2.35 2.26 2.17 2.06 
29 3.00 2.87 2.73 2.57 2.49 2.41 2.33 2.23 2.14 2.03 
30 2.98 2.84 2.70 2.55 2.47 2.39 2.30 2.21 2.11 2.01 


40 2.80 2.66 2.52 2.37 2.29 2.20 2.11 2.02 1.92 1.80 
60 2.63 2.50 2.35 2.20 2.12 2.03 1.94 1.84 1.73 1.60 
120 2.47 2.34 2.19 2.03 1.95 1.86 1.76 1.66 1.53 1.38 
оо 2.32 2.18 2.04 1.88 1.79 1.70 1.59 1.47 1.32 1.00 
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Tabla A.7 Factores de tolerancia para distribuciones normales 


"fue duro) 1008 ПН-мело)оу әр UOTIPZLIO]NE поэ EZIN ƏŞ ‘у рб] SHOX 
vay “ue duo) 1009 [[IH-MeIDOIJAn ‘Z ojmideo “sisápuy ¡0919513038 fo ѕәпртицэәт ‘елд “UVM А Ae1SeH M “IN YIequastg `7) әр epexde 
N о 1004 ШН DIN T орап ISAJDUY [02181015 1ицә2, SIEM V M Нм И 119999519 ‘O әр ep PV 


OTET 91 СТ 9080 91 СТ 9LST 0961 ст 9/$% 0961 $911 оо 
8097 8981 от ссс 0081 LIVI OSST бос 0081  L9L7 907 [9/71 00€ 
SE97 1681 961 TPST 5181 ТЕРТ 0887  I6IZ 681 88/7 IZIT 08/7 osz 
бст ETGT 1з Ос LEST OSPI ITET TETT 56981 9187 EPIT 86/71 007 
IPLT 1061 99ST HYT От бт  £867  OLTT SOGI 658% SLUT 6081 081 
OSST 960с 6971 +v8YZ 061 LIST 960€  SSET LLEI 67 ЄЄСС #181 oor 
E887 0802 1991 9000 #61 51 OEE  Z8ET 6661 8562 ISTZ 6881 06 
PTET PILT 8891 EELT 6961 651 ЄЛЄ ФС 9707 986% TLTT 1061 08 
PLET Єт СИТ со 0661 1851 STUE со 090с 100% 66© 661 02 
SEO'E TOTT юл LOST сос 60971 EGTE 90ST EOFT 990% EEET 8561 09 
ТЄ 69TT 11 £987 сост от сє от TƏT  9TIE 6LET 9661 os 
OSTE сс 581 8687 TOOT 6991 єє ITOT 00сс сот Soyz 107 sp 
ӨСЕ YOT 2061 IET ойс 1691  8ISE Мос LYTT EITE СРС 0600 or 
Ре ОРС 0661 6660 LT сел TIYE 8с ост  TLTE 0бс© 0607 se 
ШЕ  9IS7T OCOT PE Оссо Мт EELE  IP8T  S8ET OSEE бус ОРС oe 
00е 9с 6000  8STE 0660 881 OGE 0060 ҰС  LSVE 9с 8077 s7 
TEST 8087 9LUT СЄ 9660 9061 О BME 6ST 519% TSLT ОЕ 07 
(68Є PSST PIET IEEE ЄС 661 OETH ITTE 0с 959% ҮС LEET 61 
096$ 060  LSET OLEE 0 #61  LOEY  6LTE ESLT  TOLE 618С 9982 sI 
LEO Y £96Z7 SOT Ее  98BYZ 0002 єбє сє 8087 PSLE SS8'7 00РС LI 
ПТ 8Z0'E 0977 РЕ сс 00 сє ЕЕ UBT TIBE £067  LEVZ әт 
(бт TOE бст OTSE 97 8902 сот LOSE SPET 8/8 PS6T 08y7 sr 
LEEY 631  E6ST  S8SE 519с 60IZ LELY 809€ 60% 556% TIOE 605% А! 
ИУ 067€ Мос 659€ Мәс SSTT 68 LILE ОТЕ №0? 180 L8S7 er 
бт ОЕ шс LYLE оет Ос 605  0OL8€ OSTE  OSI'p TITE 69% а 
608+ 9SSE 8682 8с SIST сс 8085 Ст LOCE  LLU 6STE LELT П 
PLOS 8С  8ÞOE 1868 160 680 #6565 СС  T8SE ЄСЄ? 6LEE 687 от 
68E'S СОб6Є IUE ЄЙ 160$ СО 9965 OSSY СЄ 169% TESE 1967 6 
С185  S8TH  L6yE ФЕР 8ТЕ  T8ST 89#9 9667  Lblb 168% TELE ETE 8 
TIV9  8ZLy 658€ Әф OOE  9SLT /8Т/ 88#$5 I9  8bTS LO0 Y 69ЄЄ L 
SEEL 90YS ПР TOOS 80 900€ 1068 69 LEE'S 6/76 birt TILE 9 
6668 8269 Сєз 16065 EOTF LOVE  O9TOI SS8L  TIVY 99 6005 SLTP s 
L8E'TI 806 ОВЕ СЮ, 6 СО 061 OSTIT 8686 6678 0089  69€S y 
968'£Z 00111 66661] 01 95924 919 65060  TOWZZ 08681  I98ZI 9166 08Є8 € 
[19581 97H TEL 600%01 Y6OLE 09797 18S'0Z ООСС 167881 Є61091 OEPS 918  6I07E © 

66'0 s6'0 06'0 66'0 s6'0 06'0 66'0 s6'0 06'0 66'0 s6'0 06'0 и 

0-І 0-І о І о = І 
100 = 500 = 5 100 = 5 500 = 5 
Ѕәүеләјеүшип SO[BA.I9JUJ S3[8.1938[1Q SO[BA.I9JUJ 


вәтешлоип SIUOIINQIASTP віва PIDUBIDO) әр ѕәлојов L'V PIQBL 
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Tabla A.8 Tamaño muestral para la prueba г de la media 


Nivel de la prueba £ 
Prueba unilateral а = 0.005 а = 0.01 а = 0.025 а = 0.05 
Prueba bilateral о = 0.01 a = 0.02 а = 0.05 а = 0.1 
8= 01 01.051 2 5 01.05 1 2 5.01.05 1 2 5.01.05 1 2 .5 
0.05 
0.10 
0.15 122 
0.20 139 99 70 
0.25 110 90 128 64 139 101 45 
0.30 134 78 115 63 119 90 45 122 97 71 32 
0.35 125 99 58 109 85 47 109 88 67 34 90 72 52 24 
0.40 115 97 77 45 101 85 66 37117 84 68 51 26101 70 55 40 19 
0.45 92 77 62 37110 81 68 53 30 93 67 54 41 21 80 55 44 33 15 
0.50 100 75 63 51 30 90 66 55 43 25 76 54 44 34 18 65 45 36 27 13 
0.55 83 63 53 42 26 75 55 46 36 21 63 45 37 28 15 54 38 30 22 11 
0.60 71 53 45 36 22 63 47 39 31 18 53 38 32 24 13 46 32 26 19 9 
0.65 61 46 39 31 20 55 41 34 27 16 46 33 27 21 12 39 28 22 17 8 
0.70 53 40 34 28 17 47 35 30 24 14 40 29 24 19 10 34 24 19 15 8 
0.75 47 36 30 25 16 42 31 27 21 1 35 26 21 16 9 30 21 17 13 7 
0.80 41 32 27 22 14 37 28 24 19 12 31 22 19 15 9 27 19 15 12 6 
0.85 37 29 24 20 13 33 25 21 17 11 28 21 17 13 8 24 17 14 11 6 
Valorde 0.90 34 26 22 18 12 29 23 19 16 10 25 19 16 12 7 21 15 13 10 5 
A=|ó0]/0 0.95 31 24 20 17 11 27 21 18 14 9 23 17 14 11 7 19 14 11 9 5 
1.00 28 22 19 16 10 25 19 16 13 9 21 16 13 10 6 18 13 11 8 5 
11 24 19 16 14 9 21 16 14 12 8 18 13 11 9 6 15 11 9 7 
12 21 16 14 12 8 18 14 12 10 7 15 12 10 8 5 13 10 8 6 
13 18 15 13 11 8 16 13 11 9 6 13 10 9 7 1 8 7 6 
1.4 16 13 12 10 7 14 11 10 9 6 12 9 8 7 10 8 7 5 
15 15 12 11 9 7 13 10 9 8 6 11 8 7 6 9 7 6 
1.6 13 11 10 8 6 12 10 9 7 5 10 8 7 6 8 6 6 
17 12 10 9 8 6 11 9 8 7 9 7 6 5 8 6 5 
189 12 10 9 8 6 10 8 7 7 8 7 6 7 6 
19 11 9 8 7 610 8 7 6 8 6 6 7 5 
20 10 8 8 7 5 9 7 7 6 7 6 5 6 
21 10 $ 7 7 8 7 6 6 7 6 6 
РУ) 9 8 7 6 8 7 6 5 7 6 6 
2.3 97 7 6 8 6 6 6 5 5 
2.4 8 7 7 6 7 6 6 6 
2.5 8 7 6 6 7 6 6 6 
30 7 6 6 5 6 5 5 5 
3.5 6 5 5 5 
4.0 6 


Reproducida con autorización de O. L. Davies, ed., Design and Analysis of Industrial Experiments, Oliver & 


Boyd, Edimburgo, 1956. 


Tabla A.9 Tamaño muestral para la prueba г de la diferencia entre dos medias 


Tabla A.9 Tamaño muestral para la prueba г de la diferencia entre dos medias 
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Nivel de la prueba t 
Prueba unilateral о = 0.005 о = 0.01 о = 0.025 о = 0.05 
Prueba bilateral а = 0.01 о = 0.02 о = 0.05 а = 0.1 
8= 0.1 01.05.141 .2 .5 .01 .05 1 2 15.01.05 1 2 15.01.05 1 22 .5 
0.05 
0.10 
0.15 
0.20 137 
0.25 124 88 
0.30 123 87 61 
0.35 110 90 64 102 45 
0.40 85 70 100 50 108 78 35 
0.45 118 68 101 55 105 79 39 108 86 62 28 
0.50 96 55 106 82 45 106 86 64 32 88 70 51 23 
0.55 101 79 46 106 88 68 38 87 71 53 27112 73 58 42 19 
0.60 101 85 67 39 90 74 58 32104 74 60 45 23 89 61 49 36 16 
0.65 87 73 57 34 104 77 64 49 27 88 63 51 39 20 76 52 42 30 14 
0.70 100 75 63 50 29 90 66 55 43 24 76 55 44 34 17 66 45 36 26 12 
0.75 88 66 55 44 26 79 58 48 38 21 67 48 39 29 15 57 40 32 23 11 
0.80 77 58 49 39 23 70 51 43 33 19 59 42 34 26 14 50 35 28 21 10 
0.85 69 51 43 35 21 62 46 38 30 17 52 37 31 23 12 45 31 25 18 9 
Valorde 0.90 62 46 39 31 19 55 41 34 27 15 47 34 27 21 11 40 28 22 16 8 
А = [8/9 0.95 55 42 35 28 17 50 37 31 24 14 42 30 25 19 10 36 25 20 15 7 
100 50 38 32 26 15 45 33 28 22 13 38 27 23 17 9 33 23 18 14 7 
1.1 42 32 27 22 13 38 28 23 19 11 32 23 19 14 8 27 19 15 12 6 
1.2 36 27 23 18 11 32 24 20 16 9 27 20 16 12 7 23 16 13 10 5 
1.3 31 23 20 16 10 28 21 17 14 8 23 17 14 11 6 20 14 11 9 5 
1.4 27 20 17 14 9 24 18 15 12 8 20 15 12 10 6 17 12 10 8 4 
1.5 24 18 15 13 8 21 16 14 11 7 18 13 11 9 5 15 11 9 7 4 
1.6 21 16 14 11 7 19 14 12 10 6 16 12 10 8 5 14 10 8 6 4 
1.7 19 15 13 10 7 17 13 11 9 6 14 11 9 7 4 12 9 7 6 3 
1.8 17 13 71 10 6 15 12 10 8 5 1310 8 6 411 8 7 5 
1.9 16 12 11 9 6 14 11 9 8 5 12 9 7 6 4 10 7 6 5 
2.0 14 11 10 8 6 1310 9 7 511 8 7 6 4 9 7 6 4 
2.1 1310 9 8 512 9 8 7 510 8 6 5 3 8 6 5 4 
2.2 12 10 8 7 511 9 7 6 4 9 7 6 5 8&8 6 5 4 
2.3 11 9 8 7 510 8 7 6 4 9 7 6 5 7 5 5 4 
2.4 11 9 8 6 5 10 8 7 6 4 8 6 5 4 7544 
2.5 10 8 7 6 4 9 7 6 5 4 8 6 5 4 6 5 4 3 
3.0 8 6 6 5 4 7 6 54 3 6 5 4 4 5 4 3 
3.5 6 5 5 4 3 6 5 4 4 5 4 4 3 3 4 3 
4.0 6 5 4 4 5 4 4 3 4 4 3 4 


Reproducida con autorización de O. L. Davies, ed., Design and Analysis of Industrial Experiments, Oliver & 


Boyd, Edimburgo, 1956. 
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Tabla A.10 Valores críticos para la prueba de Bartlett 


b,(0.01; n) 
Número de poblaciones, k 
2 3 4 5 6 7 8 9 10 


п 
3 0.1411 0.1672 

4 0.2843 0.3165 0.3475 0.3729 0.3937 0.4110 

5 0.3984 0.4304 0.4607 0.4850 0.5046 0.5207 0.5343 0.5458 0.5558 
6 

7 

8 


0.4850 0.5149 0.5430 0.5653 0.5832 0.5978 0.6100 0.6204 0.6293 

0.5512 0.5787 0.6045 0.6248 0.6410 0.6542 0.6652 0.6744 0.6824 

0.6031 0.6282 0.6518 0.6704 0.6851 0.6970 0.7069 0.7153 0.7225 

9 0.6445 0.6676 0.6892 0.7062 0.7197 0.7305 0.7395 0.7471 0.7536 
10 0.6783 0.6996 0.7195 0.7352 0.7475 0.7575 0.7657 0.7726 0.7786 


11 0.7063 0.7260 0.7445 0.7590 0.7703 0.7795 0.7871 0.7935 0.7990 
12 0.7299 0.7483 0.7654 0.7789 0.7894 0.7980 0.8050 0.8109 0.8160 
13 0.7501 0.7672 0.7832 0.7958 0.8056 0.8135 0.8201 0.8256 0.8303 
14 0.7674 0.7835 0.7985 0.8103 0.8195 0.8269 0.8330 0.8382 0.8426 
15 0.7825 0.7977 0.8118 0.8229 0.8315 0.8385 0.8443 0.8491 0.8532 


16 0.7958 0.8101 0.8235 0.8339 0.8421 0.8486 0.8541 0.8586 0.8625 
17 0.8076 0.8211 0.8338 0.8436 0.8514 0.8576 0.8627 0.8670 0.8707 
18 0.8181 0.8309 0.8429 0.8523 0.8596 0.8655 0.8704 0.8745 0.8780 
19 0.8275 0.8397 0.8512 0.8601 0.8670 0.8727 0.8773 0.8811 0.8845 
20 0.8360 0.8476 0.8586 0.8671 0.8737 0.8791 0.8835 0.8871 0.8903 


21 0.8437 0.8548 0.8653 0.8734 0.8797 0.8848 0.8890 0.8926 0.8956 
22 0.8507 0.8614 0.8714 0.8791 0.8852 0.8901 0.8941 0.8975 0.9004 
23 0.8571 0.8673 0.8769 0.8844 0.8902 0.8949 0.8988 0.9020 0.9047 
24 0.8630 0.8728 0.8820 0.8892 0.8948 0.8993 0.9030 0.9061 0.9087 
25 0.8684 0.8779 0.8867 0.8936 0.8990 0.9034 0.9069 0.9099 0.9124 


26 0.8734 0.8825 0.8911 0.8977 0.9029 0.9071 0.9105 0.9134 0.9158 
27 0.8781 0.8869 0.8951 0.9015 0.9065 0.9105 0.9138 0.9166 0.9190 
28 0.8824 0.8909 0.8988 0.9050 0.9099 0.9138 0.9169 0.9196 0.9219 
29 0.8864 0.8946 0.9023 0.9083 0.9130 0.9167 0.9198 0.9224 0.9246 
30 0.8902 0.8981 0.9056 0.9114 0.9159 0.9195 0.9225 0.9250 0.9271 


40 0.9175 0.9235 0.9291 0.9335 0.9370 0.9397 0.9420 0.9439 0.9455 
50 0.9339 0.9387 0.9433 0.9468 0.9496 0.9518 0.9536 0.9551 0.9564 
60 0.9449 0.9489 0.9527 0.9557 0.9580 0.9599 0.9614 0.9626 0.9637 
80 0.9586 0.9617 0.9646 0.9668 0.9685 0.9699 0.9711 0.9720 0.9728 
100 0.9669 0.9693 0.9716 0.9734 0.9748 0.9759 0.9769 0.9776 0.9783 


Reproducida de D. D. Dyer y J. Р. Keating, “Оп the Determination of Critical Values for Bartlett's Test”, J. Am. 
Stat. Assoc., 75, 1980, con autorización del consejo de directores. 
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Tabla A.10 (continuación) Valores críticos para la prueba de Bartlett 


b,(0.05; n) 
Número de poblaciones, k 
2 3 4 5 6 7 8 9 10 


n 
3 0.3123 0.3058 0.3173 0.3299 

4 0.4780 0.4699 0.4803 0.4921 0.5028 0.5122 0.5204 0.5277 0.5341 
5 0.5845 0.5762 0.5850 0.5952 0.6045 0.6126 0.6197 0.6260 0.6315 
6 
7 
8 


0.6563 0.6483 0.6559 0.6646 0.6727 0.6798 0.6860 0.6914 0.6961 
0.7075 0.7000 0.7065 0.7142 0.7213 0.7275 0.7329 0.7376 0.7418 
0.7456 0.7387 0.7444 0.7512 0.7574 0.7629 0.7677 0.7719 0.7757 
9 0.7751 0.7686 0.7737 0.7798 0.7854 0.7903 0.7946 0.7984 0.8017 
10 0.7984 0.7924 0.7970 0.8025 0.8076 0.8121 0.8160 0.8194 0.8224 


11 0.8175 0.8118 0.8160 0.8210 0.8257 0.8298 0.8333 0.8365 0.8392 
12 0.8332 0.8280 0.8317 0.8364 0.8407 0.8444 0.8477 0.8506 0.8531 
13 0.8465 0.8415 0.8450 0.8493 0.8533 0.8568 0.8598 0.8625 0.8648 
14 0.8578 0.8532 0.8564 0.8604 0.8641 0.8673 0.8701 0.8726 0.8748 
15 0.8676 0.8632 0.8662 0.8699 0.8734 0.8764 0.8790 0.8814 0.8834 


16 0.8761 0.8719 0.8747 0.8782 0.8815 0.8843 0.8868 0.8890 0.8909 
17 0.8836 0.8796 0.8823 0.8856 0.8886 0.8913 0.8936 0.8957 0.8975 
18 0.8902 0.8865 0.8890 0.8921 0.8949 0.8975 0.8997 0.9016 0.9033 
19 0.8961 0.8926 0.8949 0.8979 0.9006 0.9030 0.9051 0.9069 0.9086 
20 0.9015 0.8980 0.9003 0.9031 0.9057 0.9080 0.9100 0.9117 0.9132 


21 0.9063 0.9030 0.9051 0.9078 0.9103 0.9124 0.9143 0.9160 0.9175 
22 0.9106 0.9075 0.9095 0.9120 0.9144 0.9165 0.9183 0.9199 0.9213 
23 0.9146 0.9116 0.9135 0.9159 0.9182 0.9202 0.9219 0.9235 0.9248 
24 0.9182 0.9153 0.9172 0.9195 0.9217 0.9236 0.9253 0.9267 0.9280 
25 0.9216 0.9187 0.9205 0.9228 0.9249 0.9267 0.9283 0.9297 0.9309 


26 0.9246 0.9219 0.9236 0.9258 0.9278 0.9296 0.9311 0.9325 0.9336 
27 0.9275 0.9249 0.9265 0.9286 0.9305 0.9322 0.9337 0.9350 0.9361 
28 0.9301 0.9276 0.9292 0.9312 0.9330 0.9347 0.9361 0.9374 0.9385 
29 0.9326 0.9301 0.9316 0.9336 0.9354 0.9370 0.9383 0.9396 0.9406 
30 0.9348 0.9325 0.9340 0.9358 0.9376 0.9391 0.9404 0.9416 0.9426 


40 0.9513 0.9495 0.9506 0.9520 0.9533 0.9545 0.9555 0.9564 0.9572 
50 0.9612 0.9597 0.9606 0.9617 0.9628 0.9637 0.9645 0.9652 0.9658 
60 0.9677 0.9665 0.9672 0.9681 0.9690 0.9698 0.9705 0.9710 0.9716 
80 0.9758 0.9749 0.9754 0.9761 0.9768 0.9774 0.9779 0.9783 0.9787 
100 0.9807 0.9799 0.9804 0.9809 0.9815 0.9819 0.9823 0.9827 0.9830 
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Tabla A.11 Valores críticos para la prueba de Cochran 
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Tabla A.12 Puntos porcentuales superiores de la distribución de rangos estudentizados: valores 
de 4(0.05; k, у) 


Grados de Número de tratamientos, k 
libertad, v 2 3 4 5 6 7 8 9 10 
1 18.0 27.0 32.8 37.2 40.5 43.1 15.1 47.1 49.1 
2 6.09 9:33 9.80 10.89 1173 12.43 13.03 13.54 13.99 
3 4.50 5.91 6.83 7.51 8.04 8.47 8.85 9.18 9.46 
4 3.93 5.04 5.76 6.29 6.71 7.06 7.35 7.60 7.83 
5 3.64 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 
6 3.46 4.34 4.90 5.31 5.63 5.89 6.12 6.32 6.49 
7 3.34 4.16 4.68 5.06 5.35 5.59 5.80 5.99 6.15 
8 3.26 4.04 4.53 4.89 5.17 5.40 5.60 5.17 5.92 
9 3.20 3.95 4.42 4.76 5.02 5.24 5.43 5.60 5.74 
10 3.15 3.88 4.33 4.66 4.91 5,12 5.30 5.46 5.60 
11 3.11 3.82 4.26 4.58 4.82 5.03 5.20 5.35 5.49 
12 3.08 3.17 4.20 4.51 4.75 4.95 5.12 5.27 5.40 
13 3.06 3.73 4.15 4.46 4.69 4.88 5.05 5.19 5.32 
14 3.03 3.70 411 4.41 4.65 4.83 4.99 5.13 5.25 
15 3.01 3.67 4.08 4.37 4.59 4.78 4.94 5.08 5.20 
16 3.00 3.65 4.05 4.34 4.56 4.74 4.90 5.03 5.05 
17 2.98 3.62 4.02 4.31 4.52 4.70 4.86 4.99 5.11 
18 2.97 3.61 4.00 4.28 4.49 4.67 4.83 4.96 5.07 
19 2.96 3.59 3.98 4.26 4.47 4.64 4.79 4.92 5.04 
20 2.95 3.58 3.96 4.24 4.45 4.62 4717 4.90 5.01 
24 2.92 3.53 3.90 4.17 4.37 4.54 4.68 4.81 4.92 
30 2.89 3.48 3.84 4.11 4.30 4.46 4.60 4.72 4.83 
40 2.86 3.44 3.79 4.04 4.23 4.39 4.52 4.63 4.74 
60 2.83 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65 
120 2.80 3.36 3.69 3.92 4.10 4.24 4.36 4.47 4.56 


оо 277 3.32 3.63 3.86 4.03 4.17 4.29 4.39 4.47 


Tabla A.13 Rangos estudentizados significativos mínimos 753 


Tabla A.13 Rangos estudentizados significativos mínimos ғ (0.05; p, v) 


a = 0.05 
р 
v 2 3 4 5 6 7 8 9 10 
1 17.97 17.97 17.97 17.97 17.97 17.97 17.97 17.97 17.97 
2 6.085 6.085 6.085 6.085 6.085 6.085 6.085 6.085 6.085 
3 4.501 4.516 4.516 4.516 4.516 4.516 4.516 4.516 4.516 
4 3.927 4.013 4.033 4.033 4.033 4.033 4.033 4.033 4.033 
5 3.635 3.749 3.797 3.814 3.814 3.814 3.814 3.814 3.814 
6 3.461 3.587 3.649 3.68 3.694 3.697 3.697 3.697 3.697 
7 3.344 3.477 3.548 3.588 3.611 3.622 3.626 3.626 3.626 
8 3.261 3.399 3.475 3.521 3.549 3.566 3.575 3.579 3.579 
9 3.199 3:339 3.420 3.470 3.502 3.523 3.536 3.544 3.547 
10 3.151 3.293 3.376 3.430 3.465 3.489 3.505 3.516 3.522 
11 3.113 3.256 3.342 3.397 3.435 3.462 3.48 3.493 3.501 


12 3.082 3.225 3.313 3.370 3.410 3.439 3.459 3.474 3.484 
13 3.055 3.200 3.289 3.348 3.389 3.419 3.442 3.458 3.470 
14 3.033 3.178 3.268 3.329 3.372 3.403 3.426 3.444 3.457 
15 3.014 3.160 3.25 3.312, 3.356 3.389 3.413 3.432 3.446 


16 2.998 3.144 3.235 3.298 3.343 3.376 3.402 3.422 3.437 
17 2.984 3.130 3.222 3.285 3.331 3.366 3.392 3.412 3.429 
18 2.971 3.118 3.210 3.274 3.321 3.356 3.383 3.405 3.421 
19 2.960 3.107 3.199 3.264 3.311 3.347 3.375 3.397 3.415 
20 2.950 3.097 3.190 3.255 3.303 3.339 3.368 3.391 3.409 


24 2.919 3.066 3.160 3.226 3.276 3315 3.345 3.370 3.390 
30 2.888 3.035 3.131 3.199 3.250 3.290 3.322 3.349 3.371 
40 2.856 3.006 3.102 3.171 3.224 3.266 3.300 3.328 3.352 
60 2.829 2.976 3.073 3.143 3.198 3.241 3.277 3.307 3.333 
120 2.600 2.947 3.045 3.116 3.172 3217 3.254 3.287 3.314 
оо 2.772 2.918 3.017 3.089 3.146 3.193 3.232 3.265 3.294 


Condensada de Н. L. Harter, “Critical Values for Duncan's New Multiple Range Test”, Biometrics, 16, núm. 4, 
1960, con autorización del autor y del editor. 
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Tabla A.13 (continuación) Rangos estudentizados significativos mínimos r,(0.01; p, v) 


a = 0.01 
p 
v 2 3 4 5 6 7 8 9 10 
1 90.03 90.03 90.03 90.03 90.03 90.03 90.03 90.03 90.03 
2 14.04 14.04 14.04 14.04 14.04 14.04 14.04 14.04 14.04 
3 8.261 8.321 8.321 8.321 8.321 8.321 8.321 8.321 8.321 
4 6.512 6.677 6.740 6.756 6.756 6.756 6.756 6.756 6.756 
5 5.702 5.893 5.989 6.040 6.065 6.074 6.074 6.074 6.074 
6 5.243 5.439 5.549 5.614 5.655 5.680 5.694 5.701 5.703 
7 4.949 5.145 5.260 5.334 5.383 5.416 5.439 5.454 5.464 
8 4.746 4.939 5.057 5.135 5.189 5.227 5.256 5.276 5.291 
9 4.596 4.787 4.906 4.986 5.043 5.086 5.118 5.142 5.160 
10 4.482 4.671 4.790 4.871 4.931 4.975 5.010 5.037 5.058 


11 4.392 4.579 4.697 4.780 4.841 4.887 4.924 4.952 4.975 
12 4.320 4.504 4.622 4.706 4.767 4.815 4.852 4.883 4.907 
13 4.260 4.442 4.560 4.644 4.706 4.755 4.793 4.824 4.850 
14 4.210 4.391 4.508 4.591 4.654 4.704 4.743 4.775 4.802 
15 4.168 4.347 4.463 4.547 4.610 4.660 4.700 4.733 4.760 


16 4.131 4.309 4.425 4.509 4.572 4.622 4.663 4.696 4.724 
17 4.099 4.275 4.391 4.475 4.539 4.589 4.630 4.664 4.693 
18 4.071 4.246 4.362 4.445 4.509 4.560 4.601 4.635 4.664 
19 4.046 4.220 4.335 4.419 4.483 4.534 4.575 4.610 4.639 
20 4.024 4.197 4.312 4.395 4.459 4.510 4.552 4.587 4.617 


24 3.956 4.126 4.239 4.322 4.386 4.437 4.480 4.516 4.546 
30 3.889 4.056 4.168 4.250 4.314 4.366 4.409 4.445 4.477 
40 3.825 3.988 4.098 4.180 4.244 4.296 4.339 4.376 4.408 
60 3.762 3.922 4.031 4.111 4.174 4.226 4.270 4.307 4.340 
120 3.702 3.858 3.965 4.044 4.107 4.158 4.202 4.239 4.272 
оо 3.643 3.796 3.900 3.978 4.040 4.091 4.135 4.172 4.205 


Tabla A.14 Valores de 4 „(К, v) para comparaciones bilaterales entre К tratamientos y un control 755 
Tabla A.14 Valores de d, оќ К, у) рага comparaciones bilaterales entre k tratamientos y un control 
a = 0.05 
К = número de medias de tratamiento (no incluye el control) 
v 1 2 3 4 5 6 7 8 9 
5 2.57 3.03 3.29 3.48 3.62 3.73 3.82 3.90 3.97 
6 2.45 2.86 3.10 3.26 3.39 3.49 3.57 3.64 3.71 
7 2.36 2.75 2.97 3.12 3.24 3.33 3.41 3.47 3.53 
8 2.31 2.67 2.88 3.02 3.13 322 3.29 3.35 3.41 
9 2.26 2.61 2.81 2.95 3.05 3.14 3.20 3.26 3.32 
10 2.23 2.57 2.76 2.89 2.99 3.07 3.14 3.19 3.24 
11 2.20 2.53 2.72 2.84 2.94 3.02 3.08 3.14 3.19 
12 2.18 2.50 2.68 2.81 2.90 2.98 3.04 3.09 3.14 
13 2.16 2.48 2.65 2.78 2.87 2.94 3.00 3.06 3.10 
14 2.14 2.46 2.63 2.75 2.84 2.91 2.97 3.02 3.07 
15 2.13 2.44 2.61 2:13 2.82 2.89 2.95 3.00 3.04 
16 2.12 2.42 2.59 2.71 2.80 2.87 2.92 2.97 3.02 
17 2.11 2.41 2.58 2.69 2.78 2.85 2.90 2.95 3.00 
18 2.10 2.40 2.56 2.68 2.76 2.83 2.89 2.94 2.98 
19 2.09 2.39 2.55 2.66 2.75 2.81 2.87 2.92 2.96 
20 2.09 2.38 2.54 2.65 2.73 2.80 2.86 2.90 2.95 
24 2.06 2.35 2.51 2.61 2.70 2.76 2.81 2.86 2.90 
30 2.04 2.32 2.47 2.58 2.66 2.72, 2.77 2.82 2.86 
40 2.02 2.29 2.44 2.54 2.62 2.68 2.73 277 2.81 
60 2.00 2.27 2.41 2.51 2.58 2.64 2.69 2.73 2.77 
120 1.98 2.24 2.38 2.47 2.55 2.60 2.65 2.69 2.73 
оо 1.96 2.21 2.35 2.44 2.51 2.57 2.61 2.65 2.69 


Reproducida de Charles W. Dunnett, “New Tables for Multiple Comparison with a Control”, Biometrics, 20, 
núm. 3, 1964, con autorización del autor y del editor. 
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Tabla A.14 (continuación) Valores de а (k, v) para comparaciones bilaterales entre k tratamientos 
y un control 


a = 0.01 
k = número de medias de tratamiento (no incluye el control) 

v 1 2 3 4 5 6 7 8 9 

5 4.03 4.63 4.98 5.22 5.41 5.56 5.69 5.80 5.89 
6 3.71 4.21 4.51 4.71 4.87 5.00 5.10 5.20 5.28 
7 3.50 3.95 4.21 4.39 4.53 4.64 4.74 4.82 4.89 
8 3.36 3.77 4.00 4.17 4.29 4.40 4.48 4.56 4.62 
9 3.25 3.63 3.85 4.01 4.12 4.22 4.30 4.37 4.43 
10 3.17 3.53 3.74 3.88 3.99 4.08 4.16 4.22 4.28 
11 3.11 3.45 3.65 3.79 3.89 3.98 4.05 4.11 4.16 
12 3.05 3.39 3.58 3.71 3.81 3.89 3.96 4.02 4.07 
13 3.01 3.33 3.52 3.65 3.74 3.82 3.89 3.94 3.99 
14 2.98 3.29 3.47 3.59 3.69 3.76 3.83 3.88 3.93 
15 2.95 3.25 3.43 3.55 3.64 3.71 3.78 3.83 3.88 
16 2.92 3.22 3.39 3.51 3.60 3.67 3:73 3.78 3.83 
17 2.90 3.19 3.36 3.47 3.56 3.63 3.69 3.74 3.79 
18 2.88 3.17 3.33 3.44 3.53 3.60 3.66 3.71 3.75 
19 2.86 315 3.31 3.42 3.50 3.57 3.63 3.68 3.72 
20 2.85 3.13 3.29 3.40 3.48 3.55 3.60 3.65 3.69 
24 2.80 3.07 3.22 3.32 3.40 3.47 3.52 3.57 3.61 
30 2.75 3.01 3.15 3.25 3:33 3.39 3.44 3.49 3.52 
40 2.70 2.95 3.09 3.19 3.26 3.32 3.37 3.41 3.44 
60 2.66 2.90 3.03 3.12 3.19 3.25 3.29 3.33 3.37 
120 2.62 2.85 2.97 3.06 3.12 3.18 3.22 3.26 3.29 


оо 2.58 2.79 2.92 3.00 3.06 3.11 3.15 3.19 3.22 


Tabla A.15 Valores de d (k, v) para comparaciones unilaterales entre k tratamientos y un control 


Tabla A.15 Valores de d (k, у) para comparaciones unilaterales entre k tratamientos y un control 
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a = 0.05 
k = número de medias de tratamiento (no incluye el control) 

v 1 2 3 4 5 6 T 8 9 

5 2.02 2.44 2.68 2.85 2.98 3.08 3.16 3.24 3.30 
6 1.94 2.34 2.56 2.71 2.83 2.92 3.00 3.07 3.12 
7 1.89 2.27 2.48 2.62 2.73 2.82 2.89 2.95 3.01 
8 1.86 2.22 2.42 2.55 2.66 2.74 2.81 2.87 2.92 
9 1.83 2.18 2.37 2.50 2.60 2.68 2.75 2.81 2.86 
10 1.81 2.15 2.34 2.47 2.56 2.64 2.70 2.76 2.81 
11 1.80 2.13 2.31 2.44 2.53 2.60 2.67 2.72 2.11 
12 1.78 211 2.29 2.41 2.50 2.58 2.64 2.69 2.74 
13 1.77 2.09 2.27 2.39 2.48 2.39 2.61 2.66 2.71 
14 1.76 2.08 2,23 2.37 2.46 2.53 2.59 2.64 2.69 
15 1.75 2.07 2.24 2.36 2.44 2.51 2.57 2.62 2.67 
16 1.75 2.06 2.23 2.34 2.43 2.50 2.56 2.61 2.65 
17 1.74 2.05 2.22 2.33 2.42 2.49 2.54 2.59 2.64 
18 1.73 2.04 2.21 2.32 2.41 2.48 2.53 2.58 2.62 
19 1.73 2.03 2.20 2.31 2.40 2.47 2.52 2.57 2.61 
20 1.72 2.03 2.19 2.30 2.39 2.46 2.51 2.56 2.60 
24 1.71 2.01 2.17 2.28 2.36 2.43 2.48 2.53 2.57 
30 1.70 1.99 2.15 2.25 2.33 2.40 2.45 2.50 2.54 
40 1.68 1.97 2.13 2.23 2.31 2.37 2.42 2.47 2.51 
60 1.67 1.95 2.10 2.21 2.28 2:39 2.39 2.44 2.48 
120 1.66 1.93 2.08 2.18 2.26 2.32 2.37 2.41 2.45 
оо 1.64 1.92 2.06 2.16 2.23 2.29 2.34 2.38 2.42 


Reproducida de Charles W. Dunnett, “А Multiple Comparison Procedure for Comparing Several Treatments 
with a Control”, J. Am. Stat. Assoc., 50, 1955, 1096-1121, con autorización del autor y del editor. 
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Tabla A.15 (continuación) Valores de а (k, v) para comparaciones unilaterales entre k tratamientos 
y un control 


a = 0.01 
К = número de medias de tratamiento (no incluye el control) 

v 1 2 3 4 5 6 7 8 9 

5 3.37 3.90 4.21 4.43 4.60 4.73 4.85 4.94 5.03 
6 3.14 3.61 3.88 4.07 4.21 4.33 4.43 4.51 4.59 
7 3.00 3.42 3.66 3.83 3.96 4.07 4.15 4.23 4.30 
8 2.90 3.29 3.51 3.67 3.79 3.88 3.96 4.03 4.09 
9 2.82 3.19 3.40 3.55 3.66 3:15 3.82 3.89 3.94 
10 2.76 3.11 3.31 3.45 3.56 3.64 3.71 3.78 3.83 
11 2.72 3.06 3.25 3.38 3.48 3.56 3.63 3.69 3.74 
12 2.68 3.01 3.19 3.32 3.42 3.50 3.56 3.62 3.67 
13 2.65 2.97 3.15 3.27 3.37 3.44 3.51 3.56 3.61 
14 2.62 2.94 3.11 3.23 3.32 3.40 3.46 3.51 3.56 
15 2.60 2.91 3.08 3.20 3.29 3.36 3.42 3.47 3.52 
16 2.58 2.88 3.05 3.17 3.26 3.33 3.39 3.44 3.48 
17 2.57 2.86 3.03 3.14 3.23 3.30 3.36 3.41 3.45 
18 2.55 2.84 3.01 3.12 3.21 3.27 3.33 3.38 3.42 
19 2.54 2.83 2.99 3.10 3.18 3.25 3.31 3.36 3.40 
20 2.53 2.81 2.97 3.08 3.17 3.23 3.29 3.34 3.38 
24 2.49 2.77 2.92 3.03 3.11 3.17 3.22 3.27 3.31 
30 2.46 2.72 2.87 2.97 3.05 3.11 3.16 3.21 3.24 
40 2.42 2.68 2.82 2.92 2.99 3.05 3.10 3.14 3.18 
60 2.39 2.64 2.78 2.87 2.94 3.00 3.04 3.08 3.12 
120 2.36 2.60 2.73 2.82 2.89 2.94 2.99 3.03 3.06 


оо 2.33 2.56 2.68 2.17 2.84 2.89 2.93 2.97 3.00 


Tabla A.16 Valores críticos para la prueba de rangos con signo 759 


Tabla A.16 Valores críticos para la prueba de rangos con signo 


Unilateral œ = 0.01 Unilateral œ = 0.025 Unilateral œ = 0.05 
n Bilateral a = 0.02 Bilateral œ = 0.05 Bilateral œ = 0.1 
5 1 
6 1 2 
7 0 2 4 
8 2 4 6 
9 3 6 8 
10 5 8 11 
11 7 11 14 
12 10 14 17 
13 13 17 21 
14 16 21 26 
15 20 25 30 
16 24 30 36 
17 28 35 41 
18 33 40 47 
19 38 46 54 
20 43 52 60 
21 49 59 68 
22 56 66 75 
23 62 73 83 
24 69 81 92 
25 77 90 101 
26 85 98 110 
27 93 107 120 
28 102 117 130 
29 111 127 141 
30 120 137 152 


Reproducida de F. Wilcoxon у К. A. Wilcox, Some Rapid Approximate Statistical Procedures, American 
Cyanamid Company, Pearl River, N. Y., 1964, con autorización de la American Cyanamid Company. 
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Tabla A.17 Valores críticos para la prueba de suma de rangos de Wilcoxon 


Prueba de una cola сор с = 0.001 o prueba de dos colas con о = 0.002 


п, 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 
1 
2 
3 0 0 0 0 
4 0 0 0 1 1 1 2 2 3 3 3 
5 0 1 1 2 2 3 3 4 5 5 6 7 T: 
6 0 1 2 2 3 4 4 Э 6 7 8 9 10 11 12 
7 2 3 3 5 6 7 8 9 10 11 13 14 15 16 
8 5 5 6 8 9 11 12 14 15 17 18 20 21 
9 7 8 10 12 14 15 17 19 21 23 25 26 
10 10 12 14 17 19 21 23 25 27 29 32 
11 15 17 20 22 24 27 29 32 34 37 
12 20 23 25 28 31 34 37 40 42 
13 26 29 32 35 38 42 45 48 
14 32 36 39 43 46 50 54 
15 40 43 47 51 35 59 
16 48 52 56 60 65 
17 57 61 66 70 
18 66 71 76 
19 77 82 
20 88 


Prueba de una cola con о = 0.01 o prueba de dos colas con о = 0.02 


п, 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 
1 
2 0 0 0 0 0 0 1 1 
3 0 0 1 1 1 2 2 2 3 3 4 4 4 5 
4 0 1 1 2 3 3 4 5 5 6 7 7 8 9 9 10 
5 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 
6 3 4 6 7 8 9 11 12 13 15 16 18 19 20 22 
7 6 8 9 11 12 14 16 17 19 2] 23 24 26 28 
8 10 11 13 15 17 20 22 24 26 28 30 32 34 
9 14 16 18 21 23 26 28 31 33 36 38 40 
10 19 22 24 27 30 33 36 38 4l 44 47 
11 25 28 -31 34 37 41 44 47 50 5 
12 31 35 38 42 46 49 53 56 60 
13 39 43 47 51 55 59 63 67 
14 47 5l 56 60 65 69 73 
15 56 61 66 70 75 80 
16 66 71 76 82 87 
17 77 82 88 93 
18 88 94 100 
19 101 107 
20 114 


Basada en parte en las tablas 1, 3, 5 y 7 de D. Auble, “Extended Tables for the Mann-Whitney Statistic”, Bulletin 
of the Institute of Educational Research at Indiana University, 1, núm. 2, 1953, con autorización del director. 


Tabla A.17 Valores críticos para la prueba de suma de rangos de Wilcoxon 


Tabla A.17 (continuación) Valores críticos para la prueba de suma de rangos de Wilcoxon 
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Prueba de una cola con о = 0.025 o prueba de dos colas con о = 0.05 


п, 


п, 5 6 7 8 9 10 1 12 13 14 15 16 17 18 19 20 
1 
2 0 0 0 0 1 1 1 1 1 2 2 2 2 
3 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 
4 1 2 3 4 4 5 6 7 8 9 10 1 11 12 B 13 
5 2 3 5 6 7 8 9 11 12 13 14 15 17 18 19 20 
6 5 6 8 10 11 13 14 16 17 19 21 2 24 25 27 
7 8 10 12 14 16 18 20 22 24 26 28 30 32 34 
8 13 15 17 19 22 24 26 29 31 34 36 38 4 
9 17 20 23 26 28 31 34 37 39 42 4 48 

10 23 26 29 33 36 39 42 45 48 52 55 

11 30 33 37 40 44 47 51 55 58 62 

12 37 41 45 49 53 57 61 65 69 

13 45 50 54 59 63 67 72 76 

14 55 59 64 67 74 78 83 

15 64 70 75 80 85 90 

16 75 81 86 92 98 

17 87 93 99 105 

18 99 106 112 

19 113 119 

20 127 

Prueba de una cola con о = 0.05 о prueba de dos colas con а = 0.1 
п, 

п, 4 5 6 7 8 9 10 1 12 13 14 15 16 17 18 19 20 
1 0 0 
2 0 0 0 1 1 1 1 2 2 3 3 3 3 4 4 4 
3 0 1 2 2 3 4 4 Э 5 6 7 7 8 9 9 10 11 
4 1 2 3 4 5 6 7 8 9 10 11 12 14 15 16 17 18 
5 4 5 6 8 9 11 12 13 15 16 18 19 20 2 23 25 
6 7 8 10 12 14 16 17 19 21 23 25 26 28 30 32 
7 1 13 15 17 19 21 24 26 28 30 33 35 37 39 
8 15 18 20 23 26 28 31 33 36 39 41 4 47 
9 21 24 27 30 33 36 39 42 45 48 51 54 

10 27 31 34 37 41 44 48 51 55 58 62 

11 34 38 42 46 50 54 57 61 65 69 

12 42 47 51 55 60 64 68 72 77 

13 51 56 61 65 70 75 80 84 

14 61 66 71 77 82 87 92 

15 72 77 83 88 94 100 

16 83 89 95 101 107 

17 96 102 109 115 

18 109 116 123 

19 123 130 

20 138 
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Tabla A.18 P(V < v* cuando H, es verdadera) en la prueba de rachas 


y* 
(n, п.) 2 3 4 5 6 7 8 9 10 
Р "2 


(2,3) 0.200 0.500 0.900 1.000 
(2,4) 0.133 0.400 0.800 1.000 
(2,5) 0.095 0.333 0.714 1.000 
(2,6) 0.071 0.286 0.643 1.000 
(2,7) 0.056 0.250 0.583 1.000 
(2,8) 0.044 0.222 0.533 1.000 
(2,9) 0.036 0.200 0.491 1.000 
(2,10) 0.030 0.182 0.455 1.000 
(3,3) 0.100 0.300 0.700 0.900 1.000 
(3,4) 0.057 0.200 0.543 0.800 0.971 1.000 
(3,5) 0.036 0.143 0.429 0.714 0.929 1.000 
(3,6) 0.024 0.107 0.345 0.643 0.881 1.000 
(3,7) 0.017 0.083 0.283 0.583 0.833 1.000 
(3,8) 0.012 0.067 0.236 0.533 0.788 1.000 
(3,9) 0.009 0.055 0.200 0.491 0.745 1.000 
(3,10) 0.007 0.045 0.171 0.455 0.706 1.000 
(4,4) 0.029 0.114 0.371 0.629 0.886 0.971 1.000 
(4,5) 0.016 0.071 0.262 0.500 0.786 0.929 0.992 1.000 
(4,6) 0.010 0.048 0.190 0.405 0.690 0.881 0.976 1.000 
(4,7) 0.006 0.033 0.142 0.333 0.606 0.833 0.954 1.000 
(4,8) 0.004 0.024 0.109 0.279 0.533 0.788 0.929 1.000 
(4,9) 0.003 0.018 0.085 0.236 0.471 0.745 0.902 1.000 
(4,10) 0.002 0.014 0.068 0.203 0.419 0.706 0.874 1.000 
(5,5) 0.008 0.040 0.167 0.357 0.643 0.833 0.960 0.992 1.000 
(5,6) 0.004 0.024 0.110 0.262 0.522 0.738 0.911 0.976 0.998 
(5,7) 0.003 0.015 0.076 0.197 0.424 0.652 0.854 0.955 0.992 
(5,8) 0.002 0.010 0.054 0.152 0.347 0.576 0.793 0.929 0.984 
(5,9) 0.001 0.007 0.039 0.119 0.287 0.510 0.734 0.902 0.972 
(5,10) 0.001 0.005 0.029 0.095 0.239 0.455 0.678 0.874 0.958 
(6,6) 0.002 0.013 0.067 0.175 0.392 0.608 0.825 0.933 0.987 
(6,7) 0.001 0.008 0.043 0.121 0.296 0.500 0.733 0.879 0.966 
(6,8) 0.001 0.005 0.028 0.086 0.226 0.413 0.646 0.821 0.937 
(6,9) 0.000 0.003 0.019 0.063 0.175 0.343 0.566 0.762 0.902 
(6, 10) 0.000 0.002 0.013 0.047 0.137 0.288 0.497 0.706 0.864 
(7,7) 0.001 0.004 0.025 0.078 0.209 0.383 0.617 0.791 0.922 
(7,8) 0.000 0.002 0.015 0.051 0.149 0.296 0.514 0.704 0.867 
(7,9) 0.000 0.001 0.010 0.035 0.108 0.231 0.427 0.622 0.806 
(7,10) 0.000 0.001 0.006 0.024 0.080 0.182 0.355 0.549 0.743 
(8,8) 0.000 0.001 0.009 0.032 0.100 0.214 0.405 0.595 0.786 
(8,9) 0.000 0.001 0.005 0.020 0.069 0.157 0.319 0.500 0.702 
(8, 10) 0.000 0.000 0.003 0.013 0.048 0.117 0.251 0.419 0.621 
(9,9) 0.000 0.000 0.003 0.012 0.044 0.109 0.238 0.399 0.601 
(9, 10) 0.000 0.000 0.002 0.008 0.029 0.077 0.179 0.319 0.510 
(10, 10) 0.000 0.000 0.001 0.004 0.019 0.051 0.128 0.242 0.414 


Reproducida de С. Eisenhart у К. Swed, “Tables for Testing Randomness of Grouping in a Sequence of 
Alternatives”, Ann. Math. Stat., 14, 1943, con autorización del editor. 
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Tabla A.18 (continuación) P(V < v* cuando H, es verdadera) en la prueba de rachas 


у 
(пп) 11 12 13 14 15 16 17 18 19 20 
(2,3) 
(2,4) 
(25) 
(2,6) 
(2,7) 
(2, 8) 
(2,9) 
(2, 10) 
(3, 3) 
(3, 4) 
(3, 5) 
(3, 6) 
(3, 7) 
(3, 8) 
(3, 9) 
(3, 10) 
(4, 4) 
(4, 5) 
(4, 6) 
(4, 7) 
(4, 8) 
(4, 9) 
(4, 10) 
(5, 5) 
(5,6) 1.000 
(5,7) 1.000 
(5,8) 1.000 
(5,9) 1.000 
(5, 10) 1.000 
(6,6) 0.998 1.000 
(6,7) 0992 0.999 1.000 
(6,8) 0.984 0.998 1.000 
(6,9) 0.972 0.994 1.000 
(6, 10) 0.958 0.990 1.000 
(7,7) 0.975 0.996 0.999 1.000 
(7,8) 0.949 0.988 0.998 1.000 1.000 
(7,9) 0.916 0.975 0.994 0.999 1.000 
(7,10) 0.879 0.957 0.990 0.998 1.000 
(8,8) 0.900 0.968 0.991 0.999 1.000 1.000 
(8,9) 0.843 0.939 0.980 0.996 0.999 1.000 1.000 
(8, 10) 0.782 0.903 0.964 0.990 0.998 1.000 1.000 
(9,9) 0.762 0.891 0.956 0.988 0.997 1.000 1.000 1.000 
(9, 10) 0.681 0.834 0.923 0.974 0.992 0.999 1.000 1.000 1.000 
(10, 10) 0.586 0.758 0.872 0.949 0.981 0.996 0.999 1.000 1.000 1.000 
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Tabla A.19 Tamaño muestral para límites de tolerancia no paramétricos bilaterales 


Le 
1-а 0.50 0.70 0.90 0.95 0.99 0.995 
0.995 336 488 777 947 1325 1483 
0.99 168 244 388 473 662 740 
0.95 34 49 77 93 130 146 
0.90 17 24 38 46 64 72 
0.85 11 16 25 30 42 47 
0.80 9 12 18 22 31 34 
0.75 7 10 15 18 24 27 
0.70 6 8 12 14 20 22 
0.60 4 6 9 10 14 16 
0.50 3 5 7 8 11 12 


Tabla A-25d de Wilfrid J. Dixon y Frank J. Massey, Jr., Introduction to Statistical Analysis, 3a. ed., McGraw- 
Hill, 1969. Reproducida con autorización de The McGraw-Hill Companies, Inc. 


Tabla A.20 Tamaño muestral para límites de tolerancia no paramétricos unilaterales 


1-7 
1-а 0.50 0.70 0.95 0.99 0.995 
0.995 139 241 598 919 1379 
0.99 69 120 299 459 688 
0.95 14 24 59 90 135 
0.90 7 12 29 44 66 
0.85 5 8 19 29 43 
0.80 4 6 14 21 31 
0.75 3 5 11 7 25 
0.70 2 4 9 13 20 
0.60 2 3 6 10 14 
0.50 1 2 5 7 10 


Tabla A-25e de Wilfrid J. Dixon y Frank J. Massey, Jr., Introduction to Statistical Analysis, 3a. ed., McGraw- 
Hill, 1969. Reproducida con autorización de The McGraw-Hill Companies, Inc. 
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Tabla A.21 Valores críticos del coeficiente de correlación de rangos de Spearman 


n о = 0.05 a = 0.025 a = 0.01 a = 0.005 

5 0.900 

6 0.829 0.886 0.943 

7 0.714 0.786 0.893 

8 0.643 0.738 0.833 0.881 

9 0.600 0.683 0.783 0.833 
10 0.564 0.648 0.745 0.794 
11 0.523 0.623 0.736 0.818 
12 0.497 0.591 0.703 0.780 
13 0.475 0.566 0.673 0.745 
14 0.457 0.545 0.646 0.716 
15 0.441 0.525 0.623 0.689 
16 0.425 0.507 0.601 0.666 
17 0.412 0.490 0.582 0.645 
18 0.399 0.476 0.564 0.625 
19 0.388 0.462 0.549 0.608 
20 0.377 0.450 0.534 0.591 
21 0.368 0.438 0.521 0.576 
22 0.359 0.428 0.508 0.562 
23 0.351 0.418 0.496 0.549 
24 0.343 0.409 0.485 0.537 
25 0.336 0.400 0.475 0.526 
26 0.329 0.392 0.465 0.515 
27 0.323 0.385 0.456 0.505 
28 0.317 0.377 0.448 0.496 
29 0.311 0.370 0.440 0.487 
30 0.305 0.364 0.432 0.478 


Reproducida de E. G. Olds, “Distribution of Sums of Squares of Rank Differences for Small Samples”, Ann. 
Math. Stat., 9, 1938, con autorización del editor. 
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ohja ӨМ ие a . А — [х1 ,a-1l5-3 Jy 
Tabla А.23 La función gamma incompleta: F (х; œ) = h Ta) e? dy 


Q 
x 1 2 3 4 5 6 7 8 9 10 
1 0.6320 0.2640 0.0800 0.0190 0.0040 0.0010 0.0000 0.0000 0.0000 0.0000 
2 0.8650 0.5940 0.3230 0.1430 0.0530 0.0170 0.0050 0.0010 0.0000 0.0000 
3 0.9500 0.8010 0.5770 0.3530 0.1850 0.0840 0.0340 0.0120 0.0040 0.0010 
4 0.9820 0.9080 0.7620 0.5670 0.3710 0.2150 0.1110 0.0510 0.0210 0.0080 
5 0.9930 0.9600 0.8750 0.7350 0.5600 0.3840 0.2380 0.1330 0.0680 0.0320 
6 0.9980 0.9830 0.9380 0.8490 0.7150 0.5540 0.3940 0.2560 0.1530 0.0840 
7 0.9990 0.9930 0.9700 0.9180 0.8270 0.6990 0.5500 0.4010 0.2710 0.1700 
8 1.0000 0.9970 0.9860 0.9580 0.9000 0.8090 0.6870 0.5470 0.4070 0.2830 
9 0.9990 0.9940 0.9790 0.9450 0.8840 0.7930 0.6760 0.5440 0.4130 
10 1.0000 0.9970 0.9900 0.9710 0.9330 0.8700 0.7800 0.6670 0.5420 
11 0.9990 0.9950 0.9850 0.9620 0.9210 0.8570 0.7680 0.6590 
12 1.0000 0.9980 0.9920 0.9800 0.9540 0.9110 0.8450 0.7580 
13 0.9990 0.9960 0.9890 0.9740 0.9460 0.9000 0.8340 
14 1.0000 0.9980 0.9940 0.9860 0.9680 0.9380 0.8910 


pa 
л 
2 
© 
© 
© 
о 


0.9970 0.9920 0.9820 0.9630 0.9300 


A.24 Demostración de la media de la distribución hipergeométrica 


Para calcular la media de la distribución hipergeométrica escribimos 


OC) „хз. = la) 
и У» Е Е к 7 со =, (\) 


_ E е, 


es) 


Puesto que 


N=k \ (W-D-(Kk-0) N\ N! N(N-1 
n=1-y) n=1-—y y n) п-п) п\п—1/” 


y con y = x — 1, obtenemos 


к=к Y Г; чысы 


nk = C р, 9) — nk 
N 4 C= N dd 


n—1 


ya que la sumatoria representa el total de todas las probabilidades en un experimento hipergeométrico cuando 
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N — 1 artículos se seleccionan al azar de № — 1, de los cuales k — 1 se etiqueta como éxitos. 


A.25 Demostración de la media y la varianza de la distribución de Poisson 


Sea u = At. 


H ЗЕ p > 
Е(Х = Ys ы A 


x=1 


Puesto que la sumatoria en el último término de la expresión anterior es la probabilidad total de una variable 
aleatoria de Poisson con media и, la cual puede verse con facilidad con y = х — 1, es igual a 1. Por lo tanto, 
E(X) = и. Para calcular la varianza de X observe que 


Е[Х(Х — D] = Ух 


x=0 


= шуух 00 —н,,х—2 
Шо erp 
тш? EN 


Nuevamente, sea y = x — 2, la sumatoria en el último término de la expresión anterior es la probabilidad 
total de una variable aleatoria de Poisson con media и. En consecuencia, obtenemos 


? = E(X?) – [EXP = Е[Х(Х —1)] + Е(Х) -EXP =P +u- = и = м. 


A.26 Prueba de la media y la varianza де la distribución gamma 


Para calcular la media y la varianza de la distribución gamma comenzamos por calcular 


ку = е+к—-1„—х/8 к=” aa хе+*-—1е—^/8 


para k = 0, 1, 2,.... Puesto que el integrando en el último término de la expresión anterior es una función de 
densidad gamma, con parámetros Q + k y 6, es igual a 1. Por lo tanto, 


k ГК +0) 


Si utilizamos la fórmula de recursividad de la función gamma de la página 194, obtenemos 


Г 1 
к= ра aß у а? =E(X?°)-p = 


¿Tía + 2) 
Г(а) =н 


2_ g2 A 2 Am 
ra TP = 1) – (аб)? =a. 


Apéndice B 


Respuestas a los ejercicios impares 


(no de repaso) 


Capítulo 1 


1.1 a) Tamaño de la muestra = 15 
b) Media de la muestra = 3.787 
с) Mediana de la muestra = 3.6 
e) Хи(әо) =3.678 
f) Son casi iguales. 


1.3 b) Sí, el proceso de envejecimiento redujo la 

resistencia a la tensión. 

с) ХСоп envejecimiento — 209.90, 
X Sin envejecimiento = 222.10 

d) XCon envejecimiento = 210.00, 
X Sin envejecimiento = 221.50 
Las medias y las medianas son similares en 
cada grupo. 


1.5 Б) Control x = 5.60, x = 5.00, х.) = 5.13. 
Tratamiento: х = 7.60, Хх = 4.50, х.) = 
5.63. 
c) El valor extremo de 37 en el grupo de trata- 
miento desempeña un papel significativo en 
el cálculo de la media. 


1.7 Varianza de la muestra = 0.943 
Desviación estándar de la muestra = 0.971 


1.9 a) Sin envejecimiento: varianza de la muestra 
= 23.66, 
desviación estándar de la muestra = 4.86. 
Con envejecimiento: varianza de la muestra 
= 42.10, 
desviación estándar de la muestra = 6.49. 

b) Con base en las cifras del inciso a), la varia- 
ción en la situación “con envejecimiento” es 
menor que en la situación “sin envejecimien- 
to”, aunque la diferencia no sea evidente en 
la gráfica. 
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1.11 


1.13 


1.15 


1.17 


1.19 


Control: varianza de la muestra = 69.38, 
desviación estándar de la muestra = 8.33. 
Tratamiento: varianza de la muestra = 128.04, 
desviación estándar de la muestra = 11.32. 


a) Media = 124.3, mediana = 120 
b) 175 es una observación extrema. 


Sí, el valor Р = 0.03125; probabilidad de obte- 
ner Н Н Н Н Н con una moneda legal. 


a) Las medias muestrales de no fumadores y 
fumadores son 30.32 y 43.70, respectiva- 
mente. 

b) Las desviaciones estándar de la muestra de 
no fumadores y fumadores son 7.13 y 16.93, 
respectivamente. 

d) Parece que a los fumadores les toma más 
tiempo quedarse dormidos. El tiempo que 
tardan los fumadores en quedarse dormidos 
es más variable. 


a) Tallo Hojas Frecuencia 
0 22233457 8 
1 023558 6 
2 035 3 
3 03 2 
4 057 3 
5 0569 4 
6 0005 4 
b) Intervalo Punto medio Frecuencia 
de clase de la clase Frecuencia relativa 
0.0-0.9 0.45 8 0.267 
1.0-1.9 1.45 6 0.200 
2.0-2.9 2.45 3 0.100 
3.0-3.9 3.45 2 0.067 
4.0-4.9 4.45 3 0.100 
5.0-5.9 5.45 4 0.133 
6.0-6.9 6.45 4 0.133 
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1.21 


1.23 


1.25 


Apéndice В 


с) Media muestral = 2.7967 
Rango muestral = 6.3 
Desviación estándar de la muestra = 2.2273 


а) х = 74.02 yx=78 
b) s = 39.26 


b) Хе = 395.10, Х|, = 160.15 

c) Las emisiones medias cayeron entre 1980 y 
1990; la variabilidad también disminuyó por- 
que no hubo emisiones mucho más grandes. 


a) Media muestral = 33.31 
b) Mediana muestral = 26.35 
d) хо) = 30.97 


Capítulo 2 


2.1 


2.3 


2.5 


2.7 


2.9 


2.11 


a) S = [8, 16, 24, 32, 40, 48) 

b) S = {-5, 1) 

c) S = {T, HT, HAT, HHR} 

Дулу = { Аїтїса, Antártida, Asia, Australia, 
Europa, Norteamérica, Sudamérica) 


e)s=0Q 
А=С 


Si utilizamos un diagrama de árbol, obtenemos 
S = (18H, 18487, 17H, ІТТ, 2H, 2T, ЗНН, ЗНТ, 
3TH, 3TT, АН, АТ, 5HH, 5НТ, 5TH, 5TT, 6H, 
6T) 


S, = {HHHH, HHHM, HHMH, HMHH, МННН, 
HHMM, HMHM, HMMH, MHMH, ММНН, 
MHHM, HMMM, MHMM, MMHM, MMMH, 
ММММ}; 

S, = (0, 1,2, 3,4) 


a) А = (ІНН, 1AT, 1TH, 1TT, 2H, 2T) 

b) В = {1ТТ, 3TT, 5TT) 

с) A' = (3HH, ЗНТ, 3TH, 3TT, АН, АТ, 5HH, 
НТ, 5TH, 5ТТ, 6H, 6T} 

d) A'N B = {ЗТТ, 5ТТ} 

e) AU B = (ІНН, 1HT, 1TH, 1TT, 2H, 2T, 
3TT, 5TT) 


a) S = {H H, H M, H M, НН, Н,М,Н,М,, 
M H, MH,, M M., М,Н,, M,H,, MM) 
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Respuestas а los ejercicios impares (no de repaso) 


2.15 


2.19 


2.21 
2.23 
2.25 
2.27 
2.29 
2.31 
2.33 
2.35 
2.37 
2.39 
2.41 


Ь)А={Н,Н„Н,М,Н,М„Н,Н„, Н,М,,Н,М,} 

c) B = {Н,М,Н,М„ H,M , H,M,, M H, МН,, 
М,Н, МН,} 

d) C = {М,М,, MM) 

e) ANB = {Н,М,, H M, Н,М,, H,M,} 

PAUB = {НН,, HM, HM, HH, HM, 
H,M,, MM,, MM) 

a) (nitrógeno, potasio, uranio, oxígeno) 

b) [cobre, sodio, zinc, oxígeno) 

c) {cobre, sodio, nitrógeno, potasio, uranio, 
zinc) 

а) [cobre uranio, zinc] 

e) ф 

f) {oxígeno} 


a) La familia experimentará fallas mecánicas, 
pero no recibirá una infracción por cometer 
una falta de tránsito, y no llegará a un lugar 
para acampar que esté lleno. 

b) La familia recibirá una infracción por come- 
ter una falta de tránsito y llegará a un lugar 
para acampar que esté lleno, pero no experi- 
mentará fallas mecánicas. 

c) La familia experimentará fallas mecánicas y 
llegará a un lugar para acampar que esté 
lleno. 

d) La familia recibirá una infracción por come- 
ter una falta de tránsito, pero no llegará a un 
lugar para acampar que esté lleno. 

e) La familia no experimentará fallas mecánicas. 


18 

156 

20 

48 

210 

72 

a) 1024; b) 243 
362,880 

2880 

a) 40,320; b) 336 
360 


Respuestas al capítulo 3 


2.43 
2.45 
2.47 
2.49 


2.51 


2.53 
2.55 
2.57 
2.59 
2.61 
2.63 
2.65 
2.67 
2.69 
2.71 
2.73 


2.75 
2.17 
2.79 
2.81 
2.83 
2.85 
2.87 
2.89 
2.91 


24 
3360 
56 


a) La suma de las probabilidades excede a 1. 

b) La suma de las probabilidades es menor 
que 1. 

с) Una probabilidad negativa. 

4) La probabilidad de un corazón y de una carta 
negra es cero. 


S = ($10, $25, $100); Р(10) = 11, P25) = ту. 
P (100) = ту; 

a) 0.3; b) 0.2 

10/117 

a) 5/26; b)9/26; c) 19/26 

a) 94/54,145; b) 143/39,984 

a) 22/25; b)3/25; c) 17/50 

a) 0.32; b) 0.68;vc) oficina o estudio 
а) 0.8; b) 0.45; с) 0.55 

а) 0.31; Б) 0.93; с) 0.31 

а) 0.009; b) 0.999; с) 0.01 

a) 0.048; b) $50,000; с) $12,500 


a) La probabilidad de que un convicto que ven- 
de drogas también cometa un robo a mano 
armada. 

b) La probabilidad de que un convicto que come- 
te un robo a mano armada no venda drogas. 

c) La probabilidad de que un convicto que no 
vende drogas tampoco cometa un robo a 
mano armada. 


a) 14/39; b)95/112 

a) 5/34; b)3/8 

а) 0.018; Б) 0.614; с) 0.166; а) 0.479 
а) 0.35; b) 0.875; с) 0.55 

а) 9/28; Ь) 3/4; с) 0.91 

0.27 

5/8 

а) 0.0016; b) 0.9984 

а) 91/323; b) 91/323 


2.93 а) 0.75112; Б) 0.2045 


2.95 


2.97 0.40625 


2.99 
2.101 


0.0960 


0.1124 
0.857 


Capítulo 3 


3.1 Discreta; continua; continua; discreta; 


3.3 


3.5 а) 1/30; b) 1/10 
3.7 a) 0.68; b) 0.375 


discreta; continua. 


Espacio muestral w 


HHH 
HHT 
HTH 
THH 
HTT 
THT 
TTH 
ТТТ 


3.9 b) 19/80 


311 x 1.2 
f(x) +1 


3.13 


3.15 


3.19 


Е(х) = 


Е(х) = 


Е(х) = 


0 
2 
7 


= y 


еы O а ` 


0, 


para x < 0, 
рага0О<х<1, 
рага1<х<2, 
рага2<х<3, 
рага3 < x < 4, 
para x > 4 


para x < 0, 
рага0 <x< l, 
para I <x < 2, 
para x > 2 
a) 4/7; b) 5/7 


3.17 b) 1/4; c)03 


1 


1 


2 


> 


> 


x<l 
1<х < 3; 1/4 
х2 3 
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0, х<0 3.51 a) х 
3.21 а) 3/2; Б) Ех) = 4 xP, 0 <х < 1; 0.3004 fœ y) 0 П 2 Е 
l, x>1 0 5 EF 5 
“боо |= 5 
2 == = 0 0 
3.23 0,  paraw<-—3, F 55 a y 
3, para— 3 < у < – І, 55 
F(w) = эт, рага—1<у<1, Ь) 42/55 
19. para l <w < 3, 3.53 5/8 
l,  paraw=3 
3.55 Independiente 
а) 20/27; b) 2/3 3.57 а) 3; b) 21/512 
3.25 t |20 25 30 3.59 Dependiente 
PTr=)|; 4 3 
327 d po (o же; Capítulo 4 
© \1 — exp(— x/2000), x>0 
г / 4.1 0.88 
b) 0.6065; c) 0.6321 
3.29 b) a 0, el 4.3 25 centavos 
a | 4.5 $1.23 
с) 0.0156 4.7 $500 
3.31 а) 0.2231; b) 0.2212 4,9 $6900 
4.11 (In4 
3.33 a) k= 280; b) 0.3633; c) 0.0563 вт 
4.13 100 horas 
3.35 а) 0.1528; b) 0.0446 
4.15 0 
3.37 а) 1/36; b) 1/15 inon 
3.39 a) x 4.19 $1855 
Јоу) [0 1 2 3 ak 
0 0 3 9 3 4.21 $833.33 
2 E E 7 
>) 1 EPPA 4.23 а) 35.2; b) p, = 3.20; ш, = 3.00 
2 п т юй 0 4.25 2 
b) 1/2 4.27 2000 horas 
3.41 a) 1/16; b) g(x) = 12x(1 —x), para 0 < x < 1; 4.29 b) 3/2 
c) 1/4 4.31 a) 1/6; b) (5/6) 
3.43 а) 3/64; b) 1/2 4.33 $5,250,000 
3.45 0.6534 4.35 0.74 
3.47 a) Dependiente; b) 1/3 4.37 1/18; en términos de utilidad real la varianza es 
1 2 
3.49 a) х 1 2 3 15 (5000)* 
g(x) | 0.10 0.35 0.55 4.39 1/6 
b) y 1 2 3 4.41 118.9 
h(y) | 0.20 0.50 0.30 4.43 ш, = 10; о? = 144 


с) 0.2857 4.45 0.01 


Respuestas al capítulo 5 773 


4.47 – 0.0062 5.17 р = 3.5, о? = 1.05 
о _ _ 
4.49 01 = 0.8456, 0, = 0.9196 ВР? пель =|, S aioi 
4.51 -1/45 1,2,13 
4.53 10.33 6.66 ds 
53 fi = 10.33, с, = 6. 
e _ 5.23 0.0077 
4.55 $0.80 
5.25 0.8670 
4.57 209 
5.27 a) 0.2852; b) 0.9887; с) 0.6083 
59 и=7/2,о? = 15/4 
кыла ий. 5.29 5/14 
4.61 3/14 М] 2 ) 
х 3—x 
106352 5.31 h(x; 6, 3, 4) = , para x = 1,2, 3; 
4.65 а) 7; b) 0; с) 12.25 6 
3 
4.67 46/63 


PQ<X<3)=4/5 
5.33 а) 0.3246; b) 0.4496 
5.35 0.9517 
5.37 a) 0.6815; b) 0.1153 


4.69 а) EX) = EY) = 1/3 y Var(X) = Var(Y) = 
4/9; b) E(Z) = 2/3 y Var(Z) = 8/9 

4.71 а) 4; Б) 32; 16 

4.73 Mediante cálculo directo, Е(е”) = 1884.32. Si 


usamos la aproximación de ajuste de segundo 5.39 0.9453 
orden, Ele”) = 1883.38, que se acerca mucho al 5.41 0.6077 


valor real. 
5.43 a) 4/33; b) 8/165 
4.75 0.03125 
5.45 0.2315 
4.77 a) Alo sumo 4/9; b) al menos 5/9; c) al menos | 
21/25; 4)10 5.47 a) 0.3991; b) 0.1316 
5,49 0.0515 
5.51 63/64 
Capítulo 5 5.53 а) 0.3840; b) 0.0067 
14 14 5.55 а) 0.0630; b) 0.9730 
5.1 ре р уух, о2= (up? ) ) 
і=1 i=l 


5.57 а) 0.1429; b) 0.1353 


5.3 f) = 5 рага x = 1,2,...,10 y f(x) = Оеп otro 5.59 a) 0.1638; b) 0.032 


caso; 3/10 5.61 0.2657 
5.5 а) 0.0480; b) 0.2375; с) Р(Х = 5|р = 0.3) = 5.63 p=6,0*=6 
0.1789, Р = 0.3 es razonable. 5.65 а) 0.2650; b) 0.9596 
5.7 а) 0.0474; b) 0.0171 5.67 а) 0.8243; b) 14 
5.9 a) 0.7073; b) 0.4613; с) 0.1484 5.69 4 
5.11 0.1240 5.71 5.53 х 10%; р = 7.5 
5.13 0.8369 5.73 а) 0.0137; Б) 0.0830 


5.15 а) 0.0778; Б) 0.3370; с) 0.0870 5.75 0.4686 


774 


Apéndice В Respuestas a los ejercicios impares (no de repaso) 


Capítulo 6 


6.3 
6.5 


6.7 
6.9 
6.11 


6.13 
6.15 


6.17 
6.19 
6.21 
6.23 
6.25 
6.27 
6.29 
6.31 
6.33 
6.35 
6.37 
6.41 
6.43 


6.45 


6.47 
6.49 


6.51 
6.53 


6.55 


a) 0.6; b) 0.7; c) 0.5 


a) 0.0823; b) 0.0250; c) 0.2424; d) 0.9236; 
e) 0.8133; f) 0.6435 


а) 0.54; Б) -1.72; с) 1.28 
а) 0.1151; b) 16.1; с) 20.275; d) 0.5403 


a) 0.0548; b) 0.4514; с) 23 tazas 4) 189.95 mi- 
lilitros 


a) 0.8980; b) 0.0287; c) 0.6080 


a) 0.0571; b) 99.11%; с) 0.3974; 4) 27.952 mi- 
nutos; e) 0.0092 


6.24 años 

a) 51%; b) $18.37 

a) 0.0401; b) 0.0244 

26 estudiantes 

a) 0.3085; b) 0.0197 

a) 0.9514; b) 0.0668 

a) 0.1171; b) 0.2049 

0.1357 

a) 0.0778; b) 0.0571; c) 0.6811 

a) 0.8749; b) 0.0059 

a) 0.0228; b) 0.3974 

2.8е 15 -3.4e* = 0.1545 

a) p =6; 0? = 18; 

b) entre 0 y 14.485 millones de litros 

3 (2) (1— e y (е—3/4 )6= = 0,3968 
х 


х=4 
а) 17/2 = 1.2533 años; b) е? 


a) Media = 0.25, mediana = 0.206; Б) varianza 
= 0.0375; с) 0.2963 


е^ = 0.0183 


a) u = aß = 50; b) 0? = 0/8? = 500; с = У500 
с) 0.815 


а) 0.1889; b) 0.0357 


6.57 
6.59 


Media = её, varianza = е!?(е* — 1) 


а) е; b) В = 0.2 


Capítulo 7 


7.1 


7.3 


7.7 
7.9 
7.11 
7.13 


7.15 


7.19 
7.23 


g@) = 1/3, para y = 1, 3, 5 
2 
E) (a +52 гай =, 22) 


o T +y2)/2 ON =y2)/2 С 


рага yı = 0, 1,2; y2 = —2,—1,0, 1,2; 
y2 < у; у +у2 = 0,2,4 


Distribución gamma con @ = 3/2 y B = т/2Ь 
а) g(y) = 32/у?, para y > 4; b) 1/4 

h(z) = 2(1 -2), para0 <z < 1 

h(w) = 6 + 6w- 12w!”, para 0 < w < 1 


2 
IN? 
80) = 


0O<y<l, 


Ambas son iguales a у. 


a) Gamma 2, 1); b) Uniforme(0, 1) 


Capítulo 8 


8.1 


8.3 
8.5 
8.7 
8.9 
8.11 


a) Las respuestas de todas las personas en Rich- 
mond que tienen teléfono; 

b) Resultados para un número grande o infinito 
de lanzamientos de una moneda; 

с) Periodo de vida de tal calzado deportivo 
cuando es utilizado en el torneo profesional; 

d) Todos los posibles intervalos de tiempo para 
esta abogada que maneja desde su casa hasta 
su oficina. 


а) х = 3.2 segundos; b) # = 3.1 segundos 
a)x=2.4;b)x=2;c)m=3 

а) 53.75; Б) 75 y 100 

а) El rango es 10; b) s = 3.307 

a) 2.971; b) 2.971 


Respuestas al capítulo 9 


8.13 
8.15 
8.17 
8.19 


8.21 
8.23 


8.25 
8.29 
8.31 


8.33 
8.35 
8.37 
8.39 
8.41 
8.45 
8.47 
8.49 
8.51 
8.53 


s = 0.585 
а) 45.9; Ь) 5.1 
0.3159 


а) La varianza se reduce de 0.49 a 0.16; 
b) La varianza se incrementa de 0.04 a 0.64. 


Sí. 
а) р = 5.3; о? = 0.81; 


b) uz = 5.3; оз = 0.0225; 
с) 0.9082 


а) 0.6898; b) 7.35 
0.5596 


а) La probabilidad de que el tiempo promedio 
de secado sea mayor que 1.0 es 0.0013; b) 13 


a) 1/2; b) 0.3085 

Р(Х < 775| u = 760) = 0.9332 

a) 27.488; b) 18.475; c) 36.415 

a) 0.297; b) 32.852; c) 46.928 

a) 0.05; b) 0.94 

a) 0.975; b) 0.10; с) 0.875; 4) 0.99 

a) 2.500; b) 1.319; c) 1.714 

No; u > 20 

a) 2.71; b) 3.51; с) 2.92; 4) 0.47; e) 0.34 


La razón F es 1.44. Las varianzas no son signi- 
ficativamente diferentes. 


Capítulo 9 


9.1 
9.3 
9.5 
9.7 
9.9 
9.11 
9.13 


56 

0.3097 < u < 0.3103 

a) 22,496 < u < 24,504; b) error < 1004 
35 

10.15 < u < 12.45 

0.978 < u < 1.033 

47.722 < u < 49.278 


9.15 
9.17 
9.19 
9.21 


9.25 


9.27 


9.35 
9.37 
9.39 
9.41 
9.43 
9.45 
9.47 
9.49 
9.51 


9.53 
9.55 
9.57 
9.59 
9.61 
9.63 
9.65 
9.67 
9.69 


9.71 
9.73 
9.75 
9.77 
9.79 
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(13,075, 33,925) 
(6.05, 16.55) 
323.946 a 326.154 


Límite superior de predicción: 9.42; 
límite superior de tolerancia: 11.72 


Sí, el valor de 6.9 está fuera del intervalo de pre- 
dicción. 


a) (0.9876, 1.0174); 
b) (0.9411, 1.0639); 
с) (0.9334, 1.0716) 


29 <p, -p,<7.1 

2.80 < ш-р, < 3.40 

1.5 < p, - 1, < 12.5 

0.70 < ш, — 1, < 3.30 

6536 < pu, — H, < 2936 
(0.74, 6.30) 

(6.92, 36.70) 

0.54652 < р, — H, < 1.69348 


Método 1: 0.194 < p < 0.262; método 2: 0.1957 
< p < 0.2639 


a) 0.498 < p < 0.642; b) error < 0.072 
a) 0.739 < p < 0.961; b) no 

a) 0.644 < p < 0.690; b) error < 0.023 
2576 

160 

9604 

—0.0136 < р, — p,, < 0.0636 

0.0011 <р, — p, < 0.0869 


(— 0.0849, 0.0013); no es significativamente 
diferente. 


0.293 < a? < 6.736; la afirmación es válida 
3.472 < о? < 12.804 

9.27 < с < 34.16 

0.549 < a, / с, < 2.690 

0.016 < 01/05 < 0.454; no 


Apéndice B Respuestas a los ejercicios impares (no de repaso) 


776 
п 
981 1 Ух; 
i=l 
9.83 д = 2/5 
9.85 б= таӣх{х1,..., хп} 
9.87 хар + (l - x) 15(1 — р). Sea la derivada con 


respecto ap = 0; p = x = 1.0 


Capítulo 10 


10.1 


10.3 


10.5 


10.7 


10.9 
10.11 
10.13 
10.15 
10.17 
10.19 
10.21 
10.23 
10.25 


10.27 
10.29 
10.31 


a) Concluya que menos de 30% del público es 
alérgico a ciertos productos de queso cuan- 
do, de hecho, 30% o más es alérgico. 

b) Concluya que al menos 30% del público es 
alérgico a ciertos productos de queso cuan- 
do, de hecho, menos de 30% es alérgico. 


a) La empresa no es culpable; 
b) la empresa es culpable. 


a) 0.0559; 
b) B = 0.0017; 8 = 0.00968; 3 = 0.5557 


a) 0.1286; 

b) 8 = 0.0901; 6 = 0.0708. 

c) La probabilidad de un error tipo I es algo 
grande. 


а) а = 0.0850; b) В = 0.3410 

а) а = 0.1357; Б) В = 0.2578 

а = 0.0094; В = 0.0122 

а) а =0.0718; b) 6 = 0.1151 

а) а = 0.0384; b) 8 = 0.5; B = 0.2776 

z = -2.76; sí, p < 40 meses; valor Р = 0.0029 
z = 1.64; valor Р = 0.10 

t = 0.77; no rechace Н. 


z = 8.97; sí, р > 20,000 kilómetros; valor Р < 
0.001 


t = 12.72; valor Р < 0.0005; rechace Н. 
t = —1.98; valor Р = 0.0312; rechace Н. 


z = —2.60; concluya que р, – р, < 12 kilo- 
gramos. 


10.33 


10.35 


10.37 
10.39 
10.41 
10.43 
10.45 
10.47 
10.49 
10.51 
10.53 


10.55 


10.57 


10.59 


10.61 


10.63 


10.65 


10.67 


10.69 


10.71 


t = 1.50; no hay evidencia suficiente para con- 
cluir que el incremento en la concentración de 
sustrato causaría un incremento en la velocidad 
media de más de 0.5 micromoles por 30 minutos. 


t = 0.70; no hay suficiente evidencia que apoye 
la conclusión de que el suero es efectivo. 


t = 2.55; rechace Н: ш, — H, > 4 kilómetros. 
ť = 0.22; no rechace Н. 

ť = 2.76; rechace H. 

t = -2.53; rechace Н; 
t = 2.48; valor P < 0.02; rechace Н. 
n=6 


la afirmación es válida. 


78.28 = 79 

5 

a) A; Mis Е М F 0, 
H: М лее T Мы + 0; 


Б) t apareada, £ = 0.99; valor Р > 0.30; no re- 
chace Н. 


valor P = 0.4044 = (con una prueba de una 
cola); no se refuta la afirmación. 


z = 1.44; no rechace H, 


z = -5.06 con valor Р ~ 0; concluya que menos 
de una quinta parte de los hogares se calienta 
con petróleo. 


z = 0.93 con valor Р = P(Z > 0.93) = 0.1762; 
no hay evidencia suficiente para concluir que la 
nueva medicina es eficaz. 


z = 2.36 con valor P = 0.0182; sí, la diferencia 
es significativa. 


z = 1.10 con valor Р = 0.1357; no tenemos eviden- 
cia suficiente para concluir que el cáncer de mama 
es más frecuente en las comunidades urbanas. 


Ж = 18.13 con valor P = 0.0676 (de los resulta- 
dos por computadora); no rechace Н: т? = 0.03. 


Ж = 63.75 con valor Р = 0.8998 (de los resul- 
tados por computadora); no rechace Н. 


X = 42.37 con valor Р = 0.0117 (de los resul- 
tados por computadora); la máquina está fuera 
de control. 


10.73 f= 1.33 con valor P = 0.3095 (de los resultados 


por computadora); no rechace Н: O, = ©. 


Respuestas al capítulo 11 


10.75 f= 0.086 con valor P = 0.0328 (de los resulta- 


dos por computadora); rechace Н: с, = ø, a un 
nivel mayor que 0.0328. 


10.77 f= 19.67 con valor P = 0.0008 (de los resulta- 


10.79 
10.81 


10.83 


10.85 
10.87 
10.89 


10.91 
10.93 


10.95 


dos por computadora); rechace Н: с, = о. 
Ж = 10.14; rechace H la razón no es 5:2:2:1. 


X? = 4.47; no hay evidencia suficiente para afir- 
mar que el dado esté cargado. 


X= 3.125; no rechace Н: distribución geomé- 
trica. 


2= 5.19; no rechace H; distribución normal. 
Х? = 5.47; no rechace Н. 


Ж = 124.59; sí, la ocurrencia de estos tipos de 
delitos depende del distrito de la ciudad. 


Xx? = 5.92 con valor Р = 0.4332; no rechace H. 


X? = 31.17 con valor P < 0.0001; las actitudes 
no son homogéneas. 


X = 1.84; no rechace Н. 


Capítulo 11 
11.1 a) b, = 64.529, b, = 0.561; 
b) $ = 81.4 
11.3 a) Y = 5.8254 + 0.5676x; 
с) Y = 34.205 a 50°C 
11.5 a) $ = 6.4136 + 1.8091x; 
b) Y = 9.580 a temperatura 1.75 
11.7 b) у= 31.709 + 0.353x 
11.9 р) y = 343.706 + 3.221x; 
с) Y = $456 con costos de publicidad = $35 
11.11 b) y =-1847.633 + 3.653x 
11.13 a) у = 153.175 — 6.324x; 
b) Ў = 123 para х = 4.8 unidades 
11.15 a) ғ = 176.4; 
b) t = 2.04; no rechace Н: 8, = 0 
11.17 а) s? = 0.40; 


11.19 


11.21 


11.23 


11.25 
11.27 


11.29 
11.31 
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b) 4.324 < В, < 8.503; 
с) 0.446 < В, < 3.172 


а) 5 = 6.626; 

b) 2.684 < B, < 8.968; 

с) 0.498 < 8, < 0.637 

t = —2.24; rechace Н, y concluya 8 < 6 


а) 24.438 < iy, < 27.106; 
b) 21.88 < y, < 29.66 


7.81 < py, < 10.81 


a) 17.1812 mpg; 

b) no, el intervalo de confianza de 95% sobre la 
media mpg es (27.95, 29.60); 

с) las millas por galón probablemente excede- 
rán a 18. 


b) $ = 3.4156x 


El valor f para probar la falta de ajuste es 1.58 y 
se concluye que no se rechaza Н. Por lo tanto, 
la prueba de falta de ajuste es insignificante. 


11.33 a) $ = 2.003x; 


b) t = 1.40, no rechace Н. 


11.35 f= 1.71 y valor P = 0.2517; la regresión es 


11.37 


11.39 


11.41 
11.43 
11.45 


11.47 


lineal. 


a) b, = 10.812, b, = 0.3437; 
b) f = 0.43; la regresión es lineal. 


a) P=-11.3251 -0.0449T: 
b) sí; 

с) R? = 0.9355; 

d) sí 


b) Ñ =-175.9025 + 0.0902Y; R? = 0.3322 
r = 0.240 


а) r = —0.979; 

Ь) Valor Р = 0.0530; no rechace H, a un nivel 
de 0.025; 

с) 95.8% 


а) r = 0.784; 
b) rechace H, y concluya дие р > 0; 
с) 61.5%. 
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Capítulo 12 


12.1 
12.3 


$ = 0.5800 + 2.7122x, + 2.0497х, 


а) Y = 27.547 + 0.922x, + 0.284x,; 
b) ў = 84 рагах, = 64ух, = 4 


а) $ = -102.7132 + 0.6054x, + 8.9236x, + 
1.4374x, + 0.0136x,; 
b) $ = 287.6 


y = 141.6118 – 0.2819x + 0.0003? 


а) Y = 56.4633 + 0.1525x – 0.000082; 
b) = 86.7% cuando la temperatura es de 
225°C 


$ =-6.5122 + 1.9994x, -3.6751x, + 2.5245x, 
+ 5.1581x, + 14.4012x, 


а) $ = 350.9943 — 1.2720x, – 0.1539x,; 
b) ў = 140.9 


12.15 Ў = 3.3205 + 0.4210x, – 0.2958х, + 0.0164x, 
+ 0.1247x,. 


0.1651 
242.72 


12.5 


12.7 
12.9 


12.11 


12.13 


12.17 
12.19 
12.21 a) 6%, = 28.0955; b) бв в, = —0.0096 


12.23 1 = 5.91 соп valor Р = 0.0002. Rechace Н, 
у asevere que 3, F 0. 


12.25 0.4516 < Hy | x, 900,521 < 1.2083 
y —0.1640 < yo < 1.8239 


12.27 263.7879 < My |х. 75, x2 = 24, x3 = 90, х4 
311.3357 у 243.7175 < уу < 331.4062 


98 < 


12.29 a) 1 = –1.09 con valor P = 0.3562; 
b) t = -1.72 con valor P = 0.1841; 
c) sí; no hay suficiente evidencia que demuestre 
que los valores de x, y x, son significativos. 


12.31 R? = 0.9997 


12.33 f= 5.106 con valor P = 0.0303; la regresión no 
es significativa en el nivel 0.01. 


12.35 f = 34.90 con valor P = 0.0002; rechace H Y 
concluya que 8, > 0. 


12.37 f= 10.18 con valor Р < 0.01; х, y x, son signi- 
ficativos en la presencia de x, y x,. 


12.39 El modelo de dos variables es mejor. 
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12.41 Primer modelo: Ría, = 92.7%, С.У. = 9.0385. 
Segundo modelo: Кы = 98.1%, С.У. = 4.6287. 
La prueba F parcial revela un valor Р = 0.0002; 
el modelo 2 es mejor. 


12.43 No hay mucha diferencia entre utilizar x, solo y 
usar x, y x, juntos, ya que Ría constituye 0.7696 
en comparación con 0.7591, respectivamente. 


а) mpg = 5.9593 — 0.00003773 odómetro + 
0.3374 octanaje — 12.6266z, — 12.9846z2; 

b) sedán 

с) no son significativamente diferentes. 


12.47 b) y = 4.690 segundos; 
с) 4.450 < Шү1180,260} < 4.930 
12.49 y = 2.1833 + 0.9576, + 3.3253х, 


12.51 а) ў = -587.211 + 428.433x; 

b) ў = 1180 — 191.691x + 35.20945x”; 
c) modelo cuadrático 

65, = 20,588; 02 = 62.6502; 
65,8, =— 1103.5 


12.45 


12.53 


12.55 
12.57 


a) Es mejor el modelo de intersección. 


a) y = 3.1368 + 0.6444х – 0.0104х, + 0.5046x, 
– 0.1197х, —2.4618x, + 1. 50445; 

Б) ў = 4. 6563 + 0. 51337, – 0. 12425; 

с) Criterio С: variables х, у х, con s* = 0.7317 
у = 0. 6476; criterio s: variables Xp X Y X, 
con s? = 0.7251 y R? = 0.6726: 

d) Y = 4.6563 + 0.5133x, – 0.1242x,; éste no 
pierde mucho en s? y RÈ. 

e) dos observaciones tienen valores grandes de 
R de Student y deben verificarse. 


а) y = 125.8655 + 7.7586x, + 0.0943x, — 
0.0092x x.; 


172° 
b) el modelo que sólo contiene х, es el mejor. 


a) ГА = (1 + е2:9949 Боов) 


b) 1.8515 


12.59 


12.61 


Capítulo 13 


13.1 f= 0.31; no hay evidencia suficiente para apo- 
yar la hipótesis de que existen diferencias entre 
las 6 máquinas. 


13.3 f= 


14.52; sí, la diferencia es significativa. 
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13.5 f = 8.38; las actividades específicas promedio 
difieren de manera significativa. 


13.7 f= 2.25; no hay evidencia suficiente para apoyar 
la hipótesis de que las diferentes concentracio- 
nes de MgNH,PO, influyen significativamente 
en la altura que alcanzan los crisantemos. 


13.9 b = 0.79 > b,(0.01, 4, 4, 4, 9) = 0.4939. No 
rechace Н. No hay suficiente evidencia para 
afirmar que las varianzas son diferentes. 


13.11 b = 0.7822 < b,(0.05, 9, 8, 15) = 0.8055. Las 
varianzas son significativamente diferentes. 


13.13 a) Valor P < 0.0001, significativa, 

b) para el contraste 1 contra 2, valor Р < 
0.00017, significativamente diferentes; para 
el contraste 3 contra 4, valor P = 0.0648, no 
es significativamente diferente. 


13.15 A continuación se presentan los resultados para 


la prueba de Tukey 
Ул. Уз. yi. 55. Ya. 
2.98 4.30 5.44 6.96 7.90 


13.17 a) valor P = 0.0121; sí, hay una diferencia sig- 
nificativa; 


Remoción 
De Hess del sustrato 
Disminución modificado de Kicknet Surber Kicknet 


13.19 f= 70.27 con valor Р < 0.0001; rechace Н. 


Х50 
72.833 


Х75 


70.500 


Х25 X 100 
60.167 64.167 


Xo 
55.167 


La temperatura es importante; tanto 75° como 
50°(C) producen baterías con vida activa signi- 
ficativamente más larga. 


13.21 La absorción media para el agregado 4 es signi- 


ficativamente menor que para el otro agregado. 


13.23 Al comparar el control con 1 y 2, significativo; 


al comparar el control con 3 y 4: insignificante 


13.25 f(fertilizante) = 6.11; existe una diferencia sig- 
nificativa entre los fertilizantes 


13.27 f = 5.99; el porcentaje de aditivos extranjeros 
no es el mismo para las tres marcas de mermela- 
da; marca A. 


13.29 Valor P < 0.0001; significativo 
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13.31 
13.33 
13.35 


Valor P = 0.0023; significativo 
Valor P = 0.1250; no significativo 


Valor P < 0.0001; 
f= 122.37; la cantidad de tinta sí influye en el 
color de la tela. 


а)у = MFA; + є, А ~ п(х; 0, д), 
єй ~ п(х;0, о); 

b) 62 = 0 (el componente de la varianza esti- 
mada es —0.00027; 0? = 0.0206. 


a) f = 14.9; los operadores difieren significati- 


vamente; 
b) 62 = 28.91; s? = 8.32. 


13.37 


13.39 


13.41 а) Yj = Ш +А; + @ А; ~ n(x;0, Oa); 
b) sí, f = 5.63 con un valor Р = 0.0121; 
c) hay un componente significativo de varianza 


del telar. 


Capítulo 14 


14.1 a) f=8.13; significativo; 
b) f = 5.18; significativo; 
c) f = 1.63; no significativo 


14.3 а) f= 14.81; significativo; 
b) f = 9.04; significativo; 
c) f = 0.61; no significativo; 
14.5 а) f= 34.40; significativo; 
b) f = 26.95; significativo; 
c) f = 20.30; significativo; 
14.7 Prueba del efecto de la temperatura: / = 10.85 
con valor Р = 0.0002; 
Prueba del efecto de la cantidad de catalizador: 
f, = 46.63 con valor P < 0.0001; 
Prueba del efecto de interacción: f = 2.06 con 
valor P = 0.074. 
14.9 a) 
Fuente de Suma de Cuadrados 
variación gl cuadrados medios F P 
Velocidad de corte 1 12.000 12.000 1.32 0.2836 
Geometría de la 
herramienta 1 675.000 675.000 74.31 < 0.0001 
Interacción 1 192.000 192.000 21.14 0.0018 
Error 8 72.667 9.083 
Total 11 951.667 


b) El efecto de la interacción oculta el efecto de 
la velocidad de corte; 
= 16.51 y valor P = 


c) Toneta de la herramienta=1 
0.0036; 


¡A de la herramienta=2 


= 5.94 y valor P = 
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14.11 а) 

Fuente Suma de Cuadrados 

de variación gl cuadrados medios f P 
Método 1 0.000104 0.000104 6.57 0.0226 
Laboratorio 6 0.008058 0.001343 84.70 < 0.0001 
Interacción 6 0.000198 0.000033 2.08 0.1215 
Error 14 0.000222 0.000016 

Total 27 0.008582 


b) La interacción no es significativa; 

c) Ambos efectos principales son significativos; 

e) AA = 0.01576 y valor P = 0.9019; no 
hay diferencia significativa entre los méto- 
dos en el laboratorio 1; 


ТРА de la herramienta=2 = 9.081 y valor P = 
0.0093. 
14.13 b) 
Fuente Suma de Cuadrados 
de variación gl cuadrados medios f P 
Tiempo 1 0.060208 0.060208 157.07 < 0.0001 
Tratamiento 1 0.060208 0.060208 157.07 < 0.0001 
Interacción 1 0.000008 0.000008 .02 0.8864 
Error 8 0.003067 0.000383 
Total 11 0.123492 


14.15 


14.17 


14.19 


c) Tanto el tiempo como el tratamiento influyen 
significativamente en la absorción del mag- 
nesio, aunque no existe interacción significa- 
tiva entre ambos. 

d) Y = р + 8, Tiempo + B,Z + 8,, Tiempo Z 
+ €, donde Z = 1 cuando el tratamiento = 1 
y Z = 0 cuando el tratamiento = 2; 

e) f = 0.02 con valor P = 0.8864; la interacción 
en el modelo no es significativa. 


a) La interacción es significativa al nivel de 
0.05, con un valor P de 0.0166. 
b) Ambos efectos principales son significativos. 
a) AB: f = 3.83; significativo; 
AC: f = 3.79; significativo; 
BC: f = 1.31; no es significativo; 
ABC: f = 1.63; no es significativo; 
b) A: f = 0.54; no es significativo; 
B: f = 6.85; significativo; 
C: f = 2.15; no es significativo; 
c) La presencia de la interacción AC enmascara 
el efecto principal C. 


a) Esfuerzo cortante: f = 45.96 con valor P < 
0.0001; 
Recubrimiento: f = 0.05 con valor P = 
0.8299; 
Humedad: f = 2.13 con valor P = 0.1257; 


recubrimiento x humedad: f = 3.41 con va- 
lor P = 0.0385; 
recubrimiento X esfuerzo cortante: f = 0.08 
con valor P = 0.9277; 
humedad x esfuerzo cortante: f = 3.15 con 
valor P = 0.0192; 
recubrimiento x humedad x esfuerzo cor- 
tante: f = 1.93 con valor P = 0.1138. 

b) La mejor combinación parece ser sin recubri- 
miento, humedad media y nivel de esfuerzo 
cortante de 20. 


14.21 Efecto f P 
Temperatura 14.22 < 0.0001 
Superficie 6.70 0.0020 
HRC 1.67 0.1954 
TxS 5.50 0.0006 
T x HRC 2.69 0.0369 
S x HRC 5.41 0.0007 
T x S x HRC 3.02 0.0051 

14.23 a) Sí; marca x tipo; marca X temperatura; 

b) sí; 
c) marca Y, detergente en polvo, alta tempera- 
tura. 

14.25 a) 

Efecto / Р 
Tiempo 543.53 < 0.0001 
Temperatura 209.79 < 0.0001 
Solvente 4.97 0.0457 
Tiempo x temperatura 2.66 0.1103 
Tiempo x solvente 2.04 0.1723 
Temperatura x solvente 0.03 0.8558 
Tiempo х temperatura х solvente 6.22 0.0140 


14.27 


14.29 


14.31 


Aunque las tres interacciones bilaterales son 
insignificantes podrían estar enmascaradas 
por la interacción trilateral significativa. 


a) f = 1.49; no hay interacción significativa; 
b) f(operadores) = 12.45; significativo; 
Filtros) = 8.39; significativo; 
с) 62 = 0.1777 (filtros); 
6% = 0.3516 (operadores); 
52 = 0.185 
а) 83, 85, Dos son significativos; 
b) 95, y б son significativos 


a) Modelo combinado; 
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b) Material: f = 47.42 con valor P < 0.0001; 
marca: f = 1.73 con valor P = 0.2875; 
material x marca: f = 16.06 con valor P = 
0.0004; 

c) no 


Capítulo 15 


15.1 
15.3 


15.5 


15.9 


15.11 


B y C son significativos al nivel 0.05 


Los factores A, B y C tienen efectos negativos 
sobre el compuesto de fósforo y el factor D tie- 
ne un efecto positivo. Sin embargo, la interpre- 
tación del efecto de los factores individuales 
debería implicar el uso de las gráficas de inte- 
racción. 


Efectos significativos: 

A: f= 9.98; BC: f= 19.03. 

Efectos insignificantes: 

B: f = 0.20; C: f = 6.54; D: f = 0.02; AB: f = 
1:83; 

AC: f = 0.20; AD: f = 0.57; BD: f = 1.83; 

CD: f = 0.02. Como la interacción BC es signi- 
ficativa, se investigaría más sobre B y sobre C. 


a) b, = 5.5, bp = -3.25 y b,, = 2.5; 
b) Los valores de los coeficientes son de la mi- 
tad de los efectos; 
с) 1, = 5.99 con valor Р = 0.0039; 
t = — 3.54 con valor Р = 0.0241; 
tig = 2.72 con valor Р = 0.0529; 
t = Е. 


a) А = 0.8750, В = 5.8750, С = 9.6250, 
АВ = 3.3750, АС = –9.6250, ВС = 0.1250 
y ABC = –1.1250; 
В, С, АВ у АС parecen importantes con base 
en sus magnitudes. 


b) Efectos Valor P 
A 0.7528 
B 0.0600 
C 0.0071 
AB 0.2440 
AC 0.0071 
BC 0.9640 
ABC 0.6861 

c) Sí; 


d) A un nivel alto de A, C esencialmente no tie- 
ne efecto. A un nivel bajo de A, C tiene un 
efecto positivo. 


15.13 a) 


781 
Máquina 

1 2 3 4 
(1) с а ас 
ab d b ad 
cd e acd ae 
ce abc ace be 
de abd ade bd 
abcd abe bcd be 
abce cde bce acde 
abde abcde bde bede 


b) ABD, CDE, ABCDE (un posible diseño) 


15.15 а) x,, tx Y X,Xy; 


b) Curvatura: valor Р = 0.0038; 
с) Un punto de diseño adicional diferente de los 
originales. 


15.17 (0, –1), (0, 1), El, 0), (1, 0) podría utilizarse. 


15.19 a) Con BCD como el contraste de definición, el 


bloque principal contiene (1), a, bc, abc, bd, 
abd, cd, аса, 
b) Bloque 1 Bloque 2 


(1) a 

bc abc 

abd bd 

acd cd 
confundido por ABC; 


c) El contraste de definición BCD produce los 
siguientes alias: A = ABCD, B = CD, C = 
BD, D = BC, AB = ACD, AC = ABD y AD 
= ABC. Puesto que AD y ABC están confun- 
didos con los bloques sólo hay dos grados de 
libertad para el error en las interacciones no 
confundidas. 


Fuente Grado 
de variación de libertad 
A 

B 

C 

D 
Bloques 
Error 


Total 


У IN =e =e- – — 


15.21 a) Con el contraste de definición ABCE y 


ABDF el bloque principal contiene (1), ab, 
аса, bcd, ce, abce, ade, bde, acf, Бс} df, арау, 
aef, bef, сае], abcdef, 
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b) A = BCE = BDF = ACDEF, 
AD = BCDE = BF = ACEF, 
B = ACE = ADF = BCDEF, 
AE = BC = BDEF = ACDF, 
C = ABE = ABCDF =DEF, 
AF = BCEF = BD = ACDE, 
D = ABCDE = ABF = СЕЕ, 
CE = AB = ABCDEF =DF, 
E = ABC = ABDEF = CDF, 
DE = ABCD = ABEF = CF, 
F = ABCEF = ABD = CDE, 
BCD = ADE = ACF = BEF, 
AB = CE = DF = ABCDEF, 
BCF = AEF = ACD = BDE, 
AC = BE = BCDF = ADEF, 
Fuente Grados 
de variación de libertad 
A 1 
B 1 
C 1 
D 1 
E 1 
F 1 
AB 1 
AC 1 
AD 1 
BC 1 
BD 1 
CD 1 
CF 1 
Error 2 
Total 15 
15.23 
Fuente gl SC CM f P 
A 1 6.1250 6.1250 5.81 0.0949 
B 1 0.6050 0.6050 0.57 0.5036 
C 1 4.8050 4.8050 4.56 0.1223 
D 1 0.2450 0.2450 0.23 0.6626 
Error 3 3.1600 1.0533 
Total 7 14.9400 
15.25 
Fuente gl SC CM f P 
A 1 388,129.00 388,129.00 3585.49 0.0001 
B 1 277,202.25 277,202.25 2560.76 0.0001 
C 1 4692.25 4692.25 43.35 0.0006 
D 1 9702.25 9702.25 89.63 0.0001 
E 1 1806.25 1806.25 16.69 0.0065 
АР 1 1406.25 1406.25 12.99 0.0113 
АЕ 1 462.25 462.25 4.27 0.0843 
Вр 1 1156.00 1156.00 10.68 0.0171 
ВЕ 1 961.00 961.00 8.88 0.0247 
Error 6 649.50 108.25 
Total 15 686,167.00 


15.27 


15.29 


15.31 
15.33 


15.35 


15.37 


Todos los efectos principales son significati- 
vos al nivel 0.05; AD, BD y BE son también 
significativos al nivel 0.05. 


El bloque principal contiene af, be, са, abd, ace, 
Бсү, def, abcdef. 


А = Вр = СЕ = СРЕ = BEF 
АРЕЕ = ABCDE, 
В = АР = СЕ = CDE 
BDEF = ABCDF, 
C = AE = BF = BDE 
ABCD = АВСЕЕ; 
ЮР = АВ = EF = ВСЕ 
АСРЕ = ABDEF, 
E = АС = DF = АВЕ 
BCEF = АСРЕЕ, 
F = ВС = DE = ACD 
ABDF = BCDEF. 


ABCF 


AEF = ABCE 


ADF = CDEF 


ACF = BCDF 


BCD = ABDE 


ABE = ACEF 


x=1lyx=1 


a) Sí; 
b) 1) E) = 79.00 + 5.2814; 
ii) Маг(у) = 6.22? 07 + 5.7074? о> + 2(6.22) 
(5.70)А 03; 
c) velocidad a bajo nivel; 
d) velocidad a bajo nivel; 
e) sí 


y = 127519 + 4.7194x, + 0.8656x, – 1.4156x,; 
las unidades están centradas y a escala; prueba 
de falta de ajuste, F = 81.58, con valor P < 
0.0001. 


AFG, BEG, CDG, DEF, CEFG, BDFG, BCDE, 
ADEG, ACDF, ABEF y ABCDEFG. 


Capítulo 16 


16.1 
16.3 
16.5 
16.7 
16.9 
16.11 
16.13 


x = 7 con valor P = 0.1719; no rechace Hy 
x = 3 con valor Р = 0.0244; rechace H,. 

x = 4 con valor P = 0.3770; no rechace Н. 
x = 4 con valor P = 0.1335; no rechace He 
w = 43; no rechace Н. 

w, = 17.5; no rechace Н. 


w, = 15 con n = 13; rechace H, a favor de 


y — hh < 8. 
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16.15 и, = 4; la afirmación no es válida 16.37 а) г = 0.71; b) rechace H,, de manera que 


р> 0. 


16.17 и, = 5; А opera durante más tiempo. 


16.19 и = 15; no rechace Н. Сарієшо 18 


16.21 h = 10.58; los tiempos de operación son dife- 


rentes. 18.1 p* = 0.173 
16.23 у = 7 con valor P = 0.910; muestra aleatoria. 18.3 a) n(p|x = 1) = 40p(1 – p} /0.2844; 0.05 < p 
16.25 у = 6 con valor Р = 0.044; no rechace Н. b) зе 
16.27 v = 4; muestra aleatoria. 18.5 а) beta(95, 45); b) 1 
16.29 0.70 18.7 8.077 < и < 8.692 
16.31 0.995 18.9 а) 0.2509; b) 68.71 < и < 71.69; с) 0.0174 
16.33 а) г, = 0.39; Б) no rechace Н. 18.13 p* = — 


16.35 a) г, = 0.72; b) rechace H,, de manera que p > 0. 18.15 2.21 
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